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全 国 高 等 学 校 五 年 制 本 科 临 床 医学 专业 
第 八 轮 


全 国 高 等 学 校 五 年 制 本 科 临 床 医学 专业 卫生 部 规划 教材 自 1978 年 第 一 轮 出 版 至 今 已 有 
35 年 的 历史 。 几 十 年 来 ,在 教育 部 卫生 部 的 领导 和 支持 下 ,以 秒 法 祖 、 吴 阶 平 . 吴 孟 超 、 陈 涉 珠 
等 院士 为 代表 的 我 国 几 代 德高望重 有 丰富 的 临床 和 教学 经 验 、 有 高 度 责任 感 和 敬业 精神 的 国 
内 外 著名 院士 \ 专 家 、 医 学 家 、 教 育 家 参与 了 本 套 教材 的 创建 和 每 一 轮 教材 的 修订 工作 ,使 我 国 
的 五 年 制 本 科 临 床 医学 教材 从 无 到 有 ,从 少 到 多 ,从 多 到 精 ,不 断 丰 富 、 完 善 与 创新 ,形成 了 课程 
门类 齐全 、 学 科 系 统 优化 、 内 容 衔接 合理 .结构 体 系 科学 的 由 规划 教材 .配套 教材 .配套 光盘 、 数 
字 出 版 .网 络 增 值 服务 组 成 的 立体 化 教材 格局 。 这 套 教材 为 我 国 千 百 万 医学 生 的 培养 和 成 才 提 
供 了 根本 保障 ,为 我 国 培养 了 一 代 又 一 代 高 水 平 、 高 素质 的 合格 医学 人 才 , 为 推动 我 国医 疗 卫生 
事业 的 改革 和 发 展 做 出 了 历史 性 巨大 贡献 ,并 通过 教材 的 创新 建设 和 高 质量 发 展 ,推动 了 我 国 
高 等 医学 本 科教 育 的 改革 和 发 展 ,促进 了 我 国医 药学 相关 学 科 或 领域 的 教材 建设 和 教育 发 展 ， 
走出 了 一 条 适合 中 国医 药学 教育 和 卫生 事业 发 展 实际 的 具有 中 国 特色 医药 学 教材 建设 和 发 
的 道路 ,创建 了 中 国 特色 医药 学 教育 教材 建设 模式 。 老 一 辈 医学 教育 家 和 科学 家 们 亲切 地 称 这 
套 教材 是 中 国医 学 教育 的 “干细胞 ”教材 。 

































































本 套 第 八 轮 教 材 修订 启动 之 时 , 正 是 全 球 医学 教育 百年 反思 之 际 ,更 是 我 国医 疗 卫生 体制 
改革 和 医学 教育 改革 全 方位 深入 推进 之 时 ,教育 部 .卫生 部 共同 召开 了 全 国医 学 教育 改革 工作 
会 议 ,启动 了 “5+3” 为 主体 的 临床 医学 教育 综合 改革 ,形成 了 以 医改 推动 教改 ,教改 服务 医改 的 
历史 发 展 格局 。 人 民 卫 生出 版 社 和 全 国 高 等 医药 教材 建设 研究 会 紧 紧 抓 住 医学 教育 综合 改革 
的 历史 发 展 机 遇 期 ,以 全 国 高 等 学 校 五 年 制 本 科 临 床 医 学 专业 第 八 轮 规划 教材 全 面 启动 为 契 
机 ,以 规划 教材 创新 建设 ,全 面 推进 国家 级 规划 教材 建设 工作 ,服务 于 医改 和 教改 。 


























第 八 轮 教材 的 修订 原则 是 积极 贯彻 落实 教育 部 卫生 部 关于 实施 临床 医学 教育 综合 改革 的 
意见 ,努力 优化 人 才 培 养 结构 ,坚持 以 需求 为 导向 ,构建 发 展 以 “5+3” 模 式 为 主体 的 临床 医学 人 
才 培 养 体系 ;改革 课程 体系 教学 内 容 .教学 方法 和 评价 考核 办 法 ;将 医德 教育 贯穿 于 医学 教育 
的 全 过 程 ,强化 临床 实践 教学 ,采取 多 种 措施 ,切实 落实 好 “ 早 临床 .多 临床 .反复 临床 "的 要 求 ， 
提高 医学 生 的 临床 实践 能 力 。 


在 全 国医 学 教育 综合 改革 精神 鼓舞 下 和 老 一 辈 医学 家 奉献 精神 的 感召 下 ,全 国 一 大 批 临 床 
教学 .科研 .医疗 第 一 线 的 中 青年 专家 ,学 者 教授 继承 和 发 扬 了 老 一 辈 的 优秀 传统 ,以 严谨 治学 
的 科学 态度 和 无 私 奉献 的 敬业 精神 ,积极 参与 第 八 轮 教材 的 修订 和 建设 工作 ,紧密 结合 五 年 抽 
临床 医学 专业 培养 目标 、 高 等 医学 教育 教学 改革 的 需要 和 医药 卫生 行业 人 才 的 需求 ,借鉴 国内 
外 医学 教育 教学 的 经 验 和 成 果 , 不 断 创新 编写 思路 和 编写 模式 ,不 断 完善 表现 形式 和 内 容 , 不 断 
提升 编写 水 平和 质量 ,已 逐渐 将 每 一 部 教材 打造 成 了 学 科 精 品 教材 ,使 第 八 轮 全 套 教材 更 加 成 





求 的 教材 体系 ,推动 了 适合 中 国 国情 的 五 年 制 本 科 临 床 医学 专业 课程 体系 的 建设 。 








本 次 修订 和 编写 特点 如 下 : 


1. 教材 编写 修订 工作 是 在 教育 部 .卫生 部 的 领导 和 支持 下 ,按照 “5+3” 为 主体 的 临床 医学 
教育 综合 改革 的 时 间 表 .路线 图 和 施工 图 进行 顶层 设计 ,由 全 国 高 等 医药 教材 建设 研究 会 规划 ， 
全 国 临床 医学 专业 教材 评审 委员 会 审定 ,院士 .专家 把 关 ,全 国 各 医学 院 校 知 名 专家 、 教 授 编 写 ， 
人 民 卫 生出 版 社 高 质量 精品 出 版 。 


2. 教材 编写 修订 工作 是 根据 教育 部 培养 目标 、 卫 生 部 行业 要 求 .社会 用 人 需求 ,在 全 国 进行 
科学 调研 的 基础 上 ,借鉴 国内 外 医学 人 才 培 养 模式 和 教材 建设 经 验 ,充分 研究 论证 本 专业 人 才 
素质 要 求 ,学科 体 系 构成 ,课程 体系 设计 和 教材 体系 规划 后 ,科学 进行 的 。 


3. 在 全 国 广泛 深入 调研 的 基础 上 ,总 结 和 汲取 了 前 七 轮 教材 的 编写 经 验 和 成 果 ,尤其 是 对 
一 些 不 足 之 处 进行 了 大 量 的 修改 和 完善 ,并 在 充分 体现 科学 性 .权威 性 的 基础 上 ,更 考虑 其 全 国 
范围 的 代表 性 和 适用 性 。 























4. 教材 编写 修订 工作 着 力 进行 课程 体系 的 优化 改革 和 教材 体系 的 建设 创新 一 一 科学 整合 
课程 ,淡化 学 科 意识 .实现 整体 优化 、 注 重 系统 科学 .保证 点 面 结合 。 继 续 坚 持 “三 基 五 性 、 三 特 
定 ” 的 教材 编写 原则 ,以 确保 教材 质量 。 


5. 为 配合 教学 改革 的 需要 减轻 学 生 负 担 和 体现 “干细胞 "教材 特色 ,全套 教材 精炼 文字 、 
压缩 字数 ,注重 提高 内 容 质量 ,并 根据 学 科 需 要 ,采用 大 16 开国 际 开本 、 双 色 或 彩色 印刷 ,以 提 
高 印 装 质量 和 可 读 性 。 同 时 ,在 每 一 页 都 增加 了 留 白 ,便于 学 生 记 录 和 标记 书 中 重点 知识 。 


6. 为 满足 教学 资源 的 多 样 化 需求 ,实现 教材 系列 化 立体 化 和 数字 化 建设 ,大 部 分 教材 配 有 
配套 教材 和 数字 出 版 的 教学 资料 ,并 实现 了 全 套 教材 的 网 络 增值 服务 ,方便 老师 教学 和 学 生 自 
主 学 习 ,实现 了 数字 化 资源 共享 。 


第 八 轮 教材 共有 53 种 ,其 中 新 增 2 种 , 即 《 医 患 沟通 》 和 《肿瘤 学 概论 六 更 名 1 种 , 即 《 急 诊 
医学 更 名 为 《急诊 与 灾难 医学 ;合并 2 种 , 即 《 生 物化 学 》 与 《医学 分 子 生物 学 》 合 并 为 《生物 
化 学 与 分 子 生物 学 》。 全 套 教 材 均 为 “十 二 五 "普通 高 等 教育 本 科 国家 级 规划 教材 ( 除 《 肿 瘤 学 
概论 》) 外 ) 和 卫生 部 “十 二 五 ”规划 教材 ,于 2013 年 6 月 全 部 出 版 发 行 。 


本 套 教材 是 在 我 国医 学 教育 综合 改革 ,构建 “5+3" 为 主体 的 临床 医学 人 才 培养 体系 背景 下 
组 织 编写 的 ,希望 全 国 各 广大 院 校 在 使 用 过 程 中 能 够 多 提供 宝贵 意见 ,反馈 使 用 信息 ,以 逐步 修 
改 和 完善 教材 内 容 , 提 高 教材 质量 ,为 第 九 轮 教材 的 修订 工作 建言 献策 。 
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高 水 平 高 质量 的 医学 教育 既是 办 好 人 民 满 意 教育 的 重要 组 成 部 分 ,也 是 医疗 卫生 事业 改 
革 发 展 的 重要 支撑 。 随 着 我 国医 药 卫生 体制 改革 的 不 断 深入 ,对 高 等 医学 教育 改革 也 提出 了 更 
高 的 要 求 。 如 何 培养 适应 国家 需要 、 人 民 满 意 的 高 质量 高 水 平 医学 人 才 是 当前 医学 教育 的 首 
要 任务 。 为 此 ,在 “十 二 五 "开局 之 年 ,教育 部 和 卫生 部 共同 组 织 实施 了 医学 教育 综合 改革 。 


医学 教育 综合 改革 要 求 我 们 深入 贯彻 落实 教育 规划 纲要 和 医药 卫生 体制 改革 的 意见 ,遵循 
医学 教育 规律 ,以 改革 创新 为 动力 ,着 力 于 医学 教育 发 展 与 医药 卫生 事业 发 展 的 紧密 结合 ,着力 
于 人 才 培 养 模式 和 体制 ,机制 的 重点 突破 ,着 力 于 医学 生 职 业 道德 和 临床 实践 能 力 的 显著 提升 ， 
着 力 于 医学 教育 质量 保障 体系 的 明显 加 强 ,从 而 全 面 提高 医学 人 才 培养 质量 ,为 发 展 医药 卫生 
事业 和 提高 人 民 健康 水 平 提供 坚实 的 人 才 保 障 。 























教材 建设 在 提高 人 才 培养 质量 中 发 挥 着 重要 的 基础 性 作用 ,对 此 教育 部 一 直 高 度 重视 ,要 
求 以 教材 建设 为 抓 手 ,推动 医学 课程 和 教学 方法 改革 。 一 本 好 的 教材 ,给 医学 生 以 正确 的 引导 ， 
给 临床 医生 以 正确 的 指导 。 人 民 卫 生出 版 社 作为 国家 级 优秀 出 版 单位 ,承担 了 大 量 教材 的 规划 
和 出 版 工作 ,形成 了 课程 种 类 齐全 ,学 科 体系 合理 ,配套 服务 全 面 的 教材 出 版 模式 。 尤 其 是 在 以 
吴阶平 . 胡 法 祖 、 吴 孟 超 、 陈 当 珠 等 院士 为 代表 的 老 一 非 医 学 大 家 的 付出 和 带领 下 ,在 一 大 批 医 
学 教育 精英 的 努力 和 参与 下 ,其 出 版 的 五 年 制 本 科 临 床 医学 专业 规划 教材 为 我 国医 学 界 培养 了 
一 代 又 一 代 优秀 的 医药 学 人 才 ,为 推动 我 国医 疗 卫生 事业 的 改革 和 发 展 做 出 了 巨大 的 历史 贡献 。 





此 次 第 八 轮 五 年 制 本 科 临 床 医学 专业 规划 教材 的 修订 工作 是 在 贯彻 党 的 十 八大 关于 “深化 
教育 领域 综合 改革 "精神 的 背景 下 ,在 落实 卫生 部 教育 部 联合 下 发 的 (关于 实施 临床 医学 教育 
综合 改革 的 若干 意见 》 的 基础 上 启动 的 。 修 订 工 作 贯 穿 了 医学 教育 综合 改革 的 要 求 ,特别 是 注 
四 将 医德 教 育 贯穿 于 医学 教育 的 全 过 程 ,增加 了 《 医 串 沟通) 一 书 ,同时 强化 临床 实践 教学 ,配套 
编写 了 相关 的 实践 指导 ,以 提高 医学 生 的 临床 实践 能 力 。 


我 们 相信 ,在 教育 .卫生 系统 的 通力 合作 下 ,在 广大 医学 教育 工作 者 的 大 力 实 持 各 参 忆 下 ， 
第 八 轮 五 年 制 本 科 临 床 医学 专业 规划 教材 的 修订 出 版 对 推动 医学 教育 综合 改革 ,提高 医学 人 才 
培养 质量 将 产生 积极 的 推动 作用 。 


教育 部 部 长 助理 


公营 用 


2013 年 3 月 





马 斌 汪 


男 ,1938 年 4 月 生 于 上 海 。 教 授 , 博士 生 导 师 。1962 年 毕业 于 复旦 
大 学 数学 系 概率 统计 专业 , 之 后 在 北京 首都 医科 大 学 任教 , 享受 国家 国 
务 院 特殊 津贴 。 现 任 中 国 卫生 部 国家 医师 资格 考试 中 心 专家 委员 会 专 
家 、 北 京 市 医疗 器 械 评审 专家 委员 会 荣誉 专家 、 高 等 院 校 教育 技术 协会 

.学 术 委 员 会 委员 兼 副 秘书 长 。 

从 事 教学 工作 50 年 , 人 民 卫 生出 版 社 、 全 国 高 等 学 校医 学 五 年 制 
教材 《医学 统计 学 ) 第 3~5 版 主编 。 在 科研 方面 ,“ 中 医 关 幼 波 教授 对 肝 
炎 的 辨证 施 治 电 子 计 算 机 程序 ” 获 北京 市 科学 技术 进步 奖 一 等 奖 ,“ 医 
学 图 像 三 维 重 构 ” 获 北京 市 科学 技术 进步 奖 二 等 奖 , “虚拟 现 实 三 维 多 
媒体 中 枢 神经 解剖 学 CAI 课件" 获 北京 市 高 等 教育 教学 成 果 一 等 奖 , “ 医 
学 病例 案例 库 " 获 北 京 市 高 等 教育 教学 成 果 二 等 奖 。 主 编 《 中 医 专家 系 
统 与 中 医 知 识 库 ( 北京 出 版 社 ), 编著 《SPSS for windows 在 医学 统计 中 
的 应 用 ?第 1~4 版 (科学 出 版 社 )。 曾 获 首届 吴阶平 优秀 教师 奖 、 北 京 市 
有 突出 贡献 专家 。 















































李 康 


男 , 1957 年 10 月 生 于 黑龙 江 省 哈尔滨 市 。 博 士 ,教授 , 博士 生 导 
师 , 哈尔滨 医科 大 学 卫生 统计 学 教研 室 主任 , 澳大利亚 拉 筹 们 (Latrobe) 
大 学 兼职 教授 。 曾 留学 日 本 新 泻 大 学 医学 部 。 主 要 社会 学 术 兼职 : 中 
国 统计 学 会 理事 , 中 国 卫生 信息 学 会 理事 , 中 国 卫生 信息 学 会 统计 理论 

与 方法 专业 委员 会 副 主任 委员 , 中 国 系统 工程 学 会 医药 系统 工程 专业 
委员 会 副 主任 委员 , 中 华 预防 医学 统计 专业 委员 会 委员 ; 黑龙 江 省 统计 
学 会 常务 理事 ;《 中 国 卫生 统计 》 和 《中 国医 院 统计 》 杂 志 编 委 。 

从 事 医学 统计 学 教学 工作 30 年 , 曾 参加 10 部 《医学 统计 学 》 全 国 
规划 教材 编写 , 获 教育 部 博士 点 博士 生 导师 基金 1 项 。 在 科研 方面 , 曾 
主持 4 项 国家 自然 科学 基金 项 目 ,参加 3 项 国家 重点 研究 项 目 ; 在 国内 
外 发 表 专 业 学 术 论文 80 余 篇 。 曾 获 黑龙 江 省 高 校 师 德 先进 个 人 、 黑 龙 
江 省 卫生 系统 有 突出 贡献 中 青年 专家 。 












































贺 佳 

女 , 1963 年 7 月 生 于 吉林 省 长 春 市 。 现 任 上 海 第 二 军医 大 学 卫生 
勤务 学 系 卫生 统计 学 教研 室 主任 ,教授 , 博士 生 导 师 。 主 要 社会 兼职 : 
中 国 卫生 信息 学 会 医学 统计 教育 专业 委员 会 副 主 任 委员 , 中 国 现场 统 
计 研 究 会 生物 医学 统计 学 会 副 理事 长 , 中 国人 民 解 放 军医 学 科学 技术 
委员 会 卫生 信息 学 专业 委员 会 副 主任 委员 , 上 海 市 临床 流行 病 专业 委 
员 会 副 主任 委员 等 职 ; 上 海 市 杨浦 区 政协 委员 ; 中 国 科 学 院 上 海 生命 科 
学 研究 院 、 上 海 交 通 大 学 医学 院 健康 科学 研究 所 客座 研究 员 。 

从 事 教学 工作 至 今 27 年 。 负 责 的 《医学 统计 学 》 课 程 获 国家 精品 
课程 、 上 海 市 精品 课程 、 军 队 优质 课程 。 主 编著 作 、 教 材 17 部 , 参加 编 
写 著作 、 教 材 30 余部 。 上 海 市 领军 人 才 、 上 海 市 优秀 学 科 带 头 人 、 上 海 
市 三 八 红 旗手 标兵 。 负 责 国 家 自然 科学 基金 、 上 海 市 基础 研究 重点 等 
课题 20 余 项 。 曾 获 上 海 市 科技 进步 一 等 奖 、 二 等 奖 , 上 海 医学 科技 二 
等 奖 。 自 主 研发 软件 9 套 , 获 国家 版 权 局 著作 权 保 护 。 在 国内 外 发 表 学 
术 论 文 200 余 篇 ,特别 是 在 国际 著名 期 刊 《The Lancet》 上 发 表 一 篇 评述 。 



































杨 土 你 


男 , 1962 年 7 月 生 于 湖南 省 郴州 市 。 博 士 , 教授 , 博士 生 导师 。 现 
任 中 南大 学 公共 卫生 学 院 副 院 长 。 主 要 社会 兼职 : 湖南 省 卫生 统计 专 
业 委员 会 副 主任 委员 , 湖南 省 流行 病 学 专业 委员 会 副 主任 委员 , 湖南 省 
肿瘤 防治 专业 委员 会 副 主任 委员 ,中 国 老年 学 杂志 》 等 3 种 杂志 编 委 。 
加 拿 大 湿 太 华 大 学 和 美国 华盛顿 大 学 访问 学 者 。 

从 事 教学 工作 至 今 30 年 ,参加 国家 规划 教材 8 部 。 主 持 各 级 科研 
项 目 10 余 项 , 发 表 研究 论文 70 余 篇 , 获得 省 部 级 科研 成 果 奖 3 项 。 获 
得 湖南 省 高 校 青年 骨干 教师 和 “121” 人 才 工 程 第 三 层次 人 才 称 号 。 





马 骏 


男 , 1962 年 7 月 生 于 天 津 。 博 士 ,教授 , 博士 生 导师 。 天 津 医科 大 
学 卫生 统计 学 学 科 带 头 人 , 天 津 市 普通 高 等 学 校 卫生 统计 学 精品 课程 
负责 人 。 主 要 社会 兼职 : 中 国 统计 教育 学 会 第 五 届 理 事 , 全 国 统计 教材 
编审 委员 会 第 六 届 委 员 会 委员 , 天 津 市 医疗 保险 研究 会 副 会 长 , 天 津 市 
统计 学 会 常务 理事 , 天 津 市 现场 统计 研究 会 常务 理事 , 天 津 市 食品 药品 
监督 管理 局 审 评 专家 等 职 。 

从 事 教学 工作 28 年 。 近 年 , 主持 国家 级 课题 1 项 , 省 部 级 课题 3 项 ， 
横向 合作 课题 20 余 项 ; 发 表 论 文 80 余 篇 , 科研 工作 获 各 种 奖励 6 项 。 






































医学 统计 学 是 现代 医学 研究 中 的 一 门 基础 学 科 , 是 关于 收集 数据 和 分 析 数据 的 科学 。 医 学 
研究 中 , 由 于 生物 现象 的 变异 较 大 , 各 种 因素 错综复杂 , 实验 或 观察 结果 往往 受到 多 种 因素 的 
影响 , 而 统计 学 的 重要 作用 就 在 于 能 够 透 过 偶然 现象 来 探索 其 规律 性 , 并 以 适当 的 方式 将 研究 
结果 表达 出 来 。 医 学 统计 学 作为 建立 统计 分 析 思 维 的 必修 课程 , 有 助 于 医学 生 在 专业 学 习 和 临 
床 实践 中 更 好 地 阅读 文献 和 进行 科学 研究 。 随 着 计算 机 统计 软件 的 广泛 应 用 , 复杂 的 统计 学 计 
算 问 题 能够 快速 方便 地 得 到 解决 , 这 就 要 求 使 用 者 对 统计 学 的 基本 原理 、 方 法 及 其 应 用 条 件 有 
一 定 的 了 解 和 熟悉 , 并 且 能 够 看 懂 数 据 分 析 的 结果 。 为 此 , 本 书 注重 结合 医学 实例 介绍 统计 学 
原理 和 方法 , 而 不 拘泥 于 繁杂 的 计算 过 程 , 使 其 适合 医学 生 和 医学 研究 人 员 使 用 。 





本 教材 在 第 5 版 《医学 统计 学 》 基 础 上 做 出 适当 调整 。 在 内 容 上 , 增加 了 目前 应 用 较为 广泛 
的 一 些 统计 学 方法 , 如 重复 测量 数据 分 析 、logistic 回归 分 析 、 生 存 分 析 、 临床 试 验 设计 和 样本 含 
量 估计 等 ; 统计 图 表 一 章 增加 了 撰写 科研 论文 时 经 常 使 用 的 几 种 统计 图 ; 附录 一 给 出 了 国际 上 
临床 随机 对 照 试验 (RCT) 研 究 报 告 的 参考 标准 (2010); 附录 二 给 出 了 SPSS 软件 对 各 章 实例 分 
析 的 实现 方法 。 例 题 选择 上 , 尽量 使 用 临床 和 基础 研究 的 实际 范例 。 在 各 章 的 习题 中 ,增加 了 
单项 选择 题 的 数量 ,有 助 于 读者 对 正文 内 容 的 深入 理解 , 还 可 作为 执业 医师 资格 考试 的 参考 资 
料 。 各 高 校 可 以 根据 教学 条 件 选择 合适 的 教学 内 容 , 参考 教学 时 数 为 32~54 学 时 , 部 分 章节 可 
作为 自学 内 容 。 














本 书 的 主要 特点 是 内 容 简洁 , 通过 实例 讲解 统计 学 名 词 、 概 念 、 原 理 和 方法 , 尽量 简化 复杂 
的 运算 过 程 。 为 了 更 好 地 使 用 本 教材 , 改进 了 原 有 的 教学 配套 PPT 课件 , 并 由 第 二 军医 大 学 的 
吴 允 老师 结合 各 章 例题 , 制作 了 SPSS 统计 软件 的 视频 教学 。PPT 课件 .SPSS 视频 教学 及 教材 中 
练习 题 的 参考 答案 一 并 放 人 教材 的 网 络 增值 服务 中 。 
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在 本 章 中 , 我们 将 给 出 医学 统计 学 的 定义 和 研究 对 象 , 并 用 实例 说 明 医学 统计 学 在 医学 研 
究 中 的 重要 作用 , 同时 简要 介绍 医学 统计 学 包含 的 基本 内 容 。 在 此 基础 上 , 重点 学 习 医学 统计 | 


学 中 的 几 个 基本 概念 。 
第 一 节 ”医学 统计 学 的 作用 


医学 统计 学 (medical statistics ) 是 临床 医学 、 基 础 医学 、 公 共 卫 生 学 和 医疗 卫生 服务 研究 中 


的 一 门 基础 学 科 , 是 关于 收集 数据 、 分 析 数 据 和 由 数据 得 出 结论 的 一 组 概念 、 原 则 和 方法 。 医 | 








学 研究 中 , 由 于 生物 现象 的 变异 较 大 , 各 种 因素 错综复杂 , 由 实验 或 观察 得 到 的 结果 往往 会 受 
到 许多 随机 因素 的 影响 , 如 使 用 两 种 药物 治疗 冠 心病 , 试验 药物 和 对 照 药 物 有 效率 分 别 为 87% 








和 82%, 这 种 结果 能 否 说 明 试验 药物 优 于 对 照 药 物 ? 由 样本 数据 获得 的 结果 , 其 差别 既 可 能 是 | 
药物 本 身 作 用 引起 , 也 有 可 能 是 随机 波动 所 致 , 是 否 由 于 药物 作用 造成 了 两 组 疗效 的 差别 , 需 | 

















要 使 用 统计 学 方法 进行 推断 。 统 计 学 的 重要 作用 在 于 能 够 透 过 偶然 现象 来 探测 其 规律 性 , 使 和 
究 结 论 具 有 科学 性 。 : 

为 了 理解 统计 学 在 实际 工作 中 的 作用 和 意义 , 现 通过 两 个 经 典 案 例 来 说 明 。 

1. 1962 年 美国 医学 学 会 杂志 (JAMA ) 兽 发 表 了 一 篇 关于 胃 溃 疡 治疗 新 技术 的 报告 , 该 报告 
根据 动物 实验 和 24 名 患者 的 临床 试验 结果 得 出 结论 , 即将 冷冻 液 导入 胃 中 使 胃 冷 却 可 以 缓解 
溃疡 症状 , 之 后 这 一 研究 成 果 在 临床 中 被 广泛 应 用 。 但 有 研究 者 发 现 , 这 项 研究 在 设计 上 存在 
严重 问题 , 如 未 合理 地 设立 对 照 组 。 后 经 过 严格 的 随机 对 照 试 验 , 证 明 胃 冷却 的 方法 只 是 暂时 
性 的 绥 解 胃 部 疼痛 , 该 法 不 仅 不 能 治疗 胃 溃 疡 , 反而 可 能 会 加 重 胃 部 的 溃疡 , 从 而 否定 了 这 种 
治疗 胃 溃 疡 的 方法 。 

2. 20 世纪 80 年 代 早期 , 两 项 观察 性 研究 结果 提示 孕妇 在 怀孕 期 间 补充 维生素 可 以 降低 新 
生 儿 神经 管 缺陷 (neutral tube defect, NTD ) 的 风险 , 但 一 直 无 法 证 实 。 医学 研究 委员 会 维生素 研 
究 小 组 于 1991 年 开展 了 一 项 大 规模 的 随机 对 照 试 验 , 结果 显示 : 593 名 服用 叶酸 (B 族 维生素 ) 
的 女性 中 , 6 名 新 生 儿 患 有 神经 管 缺陷 ; 602 名 没有 服用 叶酸 的 女性 中 , 21 名 新 生 儿 患 有 神经 管 











缺陷 。 该 项 研究 使 用 统计 学 方法 确定 了 服用 叶酸 组 与 对 照 组 的 差别 不 是 简单 偶然 出 现 的 ,而 是 | 
归 因 于 叶酸 的 作用 。 | 


根据 上 述 两 个 实例 , 我们 可 以 提出 以 下 几 个 问题 : 

(1) 胃 溃 疡 治疗 新 技术 的 研究 结论 为 什么 会 出 现 错误 ? 

(2) 为 了 证 明 服用 叶酸 的 作用 , 应 如 何 进行 分 组 ? 

(3) 如 何 准确 地 估计 两 组 新 生 儿 中 出 现 神经 管 缺陷 (NTD ) 的 发 病 率 ? 

(4) 如 何 比较 两 组 NTD 的 发 病 率 是 否 有 差别 ? 

以 上 这 些 问 题 的 解决 , 都 需要 运用 统计 学 设计 原则 和 统计 分 析 方 法 。 

综 上 , 医学 统计 学 的 研究 对 象 是 医学 中 具有 不 确定 性 结果 的 事物 , 其 主要 作用 是 通过 数据 


的 偶然 性 揭示 内 在 的 规律 性 。 统 计 分 析 的 要 点 是 正确 地 选用 统计 分 析 方 法 , 并 结合 专业 知识 作 


出 科学 的 结论 。 医 学 工作 者 通过 学 习 和 运用 统计 学 方法 , 可 以 更 好 地 理解 医学 专业 杂志 的 内 
容 .撰写 科学 论文 .加 强 与 统计 专业 人 员 沟 通 的 能 力 , 从 而 达到 提高 科研 水 平 的 目的 。 


笔记 


于 了 


让 





第 二 节 ”医学 统计 学 的 基本 内 容 


医学 统计 学 的 基本 内 容 包括 统计 设计 、 数 据 整 理 、 统 计 描述 和 统计 推断 。 这 四 项 基本 内 容 
相互 联系 。 

1. 统计 设计 “医学 研究 主要 包括 实验 性 研究 和 观察 性 研究 。 研究 设计 有 专业 设计 和 统计 
设计 , 两 者 相辅相成 。 专 业 设计 主要 包括 : 选 题 、 根 据 研究 目的 确定 研究 对 象 、 处 理 因素 、 实 有 
或 观察 方法 、 实 验 材料 和 设备 、 实 验 效应 或 观察 指标 等 ; 统计 设计 主要 包括 实验 分 组 或 抽样 方 
法 、 样 本 含量 估计 、 数 据 管理 与 质量 控制 、 拟 使 用 的 统计 分 析 方法 等 。 由 于 研究 设计 上 的 错误 
在 数据 分 析 阶 段 无 法 更 正 , 所 以 在 研究 开始 时 就 应 与 统计 专业 人 员 合 作 或 向 甚 咨询。 统计 设计 

能 够 提高 研究 效率 , 并 使 结果 更 加 准确 和 可 靠 。 

2. 数据 整理 ”数据 整理 主要 是 指 对 数据 质量 进行 的 检查 , 考虑 数据 分 布 及 变量 转换 , 检查 
异常 值 和 数据 是 否 符合 特定 的 统计 分 析 方法 要 求 等 。 有 效 数字 使 用 以 同一 形式 表达 , 使 人 容易 
| 领会 并 确信 在 实验 或 观察 过 程 中 数据 的 精密 度 始 终 保持 一 致 。 医 学 研究 中 , 当 观测 到 的 偏差 比 

合理 预期 大 时 , 应 当 仔细 考虑 , 如 果 没 有 充分 的 理由 说 明 它 是 不 合理 的 , 就 应 当 予 以 保留 ; 随意 
将 那些 自 认 为 “过 大 或 过 小 "的 数据 舍弃 掉 , 不 仅 可 能 使 实验 研究 的 真实 性 受到 破坏 , 还 有 可 能 
失去 新 发 现 的 机 会 (如 基因 突变 )。 

3. 统计 描述 ”统计 描述 用 来 描述 及 总 结 一 组 数据 的 重要 特征 , 其 目的 是 使 实验 或 观察 
到 的 数据 表达 清楚 并 便于 分 析 。 通 常 , 统计 描述 给 出 资料 的 大 致 轮廓 和 进 一 ee 
| 果 的 表达 方式 主要 是 统计 指标 、 统 计 表 和 统计 图 。 统 计 指 标的 作用 是 把 大 量 数据 用 简单 的 数字 
| 表达 它 的 一 些 重要 特征 , 帮助 形成 对 总 体 的 看 法 , 如 数据 的 平均 水 平和 变异 程度 。 统 计 表 是 
” 写 统 计 分 析 报告 和 撰写 科学 论文 必 不 可 少 的 表达 形式 , 其 作用 是 可 以 代替 宛 长 的 文字 叙述 , 便 
于 分 析 和 对 比 。 统 计 图 能 够 更 生动 ,形象 地 表达 结果 , 给 人 以 深刻 印象 。 统 计 图 表 的 正确 使 用 
对 撰写 科学 论文 的 质量 有 很 大 的 影响 。 如 果 一 组 数据 是 整个 总 体 的 观察 结果 , 统计 描述 即 可 得 
出 明确 的 结论 , 但 更 多 情况 是 数据 来 自 随机 抽取 的 样本 , 这 时 还 需要 使 用 统计 推断 方法 。 

4. 统计 推断 ”统计 推断 指 由 样本 数据 的 特征 推断 总 体 特征 的 方法 , 包括 参数 估计 和 假设 检 

参数 估计 分 为 点 估计 和 区 间 估计 。 区 间 估 计 的 重要 性 在 于 可 以 得 出 估计 不 准 的 概率 。 例 
如 ,在 研究 某 种 新 药 的 降 压 效果 时 ,舒张 压 治疗 前 后 差 值 的 95% 可 信 区 间 为 10.41~13.05mmHg， 
即 真实 差 值 没有 被 包含 在 这 一 区 间 内 的 概率 只 有 5%。 假 设 检验 则 是 从 另 一 角度 去 分 析 数 据 ， 
重点 是 比较 参数 的 大 小 。 由 于 存在 生物 个 体 变异 和 随机 测量 误差 , 不 能 简单 地 根据 样本 计算 出 
的 结果 直接 判断 总 体 的 情况 。 如 欲 比较 甲乙 两 种 治疗 高 血压 药物 的 疗效 , 试验 结果 显示 申 药 平 
均 降 压 11mmHg, 乙 药 平均 降 压 7mmHg, 由 于 抽样 计 且 差 的 凡响 ， 并 不 能 说 明 甲 药 的 降 压 效果 优 
于 乙 药 ,重新 再 做 一 次 试验 很 可 能 会 得 到 相反 的 结果 。 假 设 检验 的 作用 是 能 够 辨别 ! 二 
动 引起 这 种 差别 的 概率 大 小 ,如 果 概 率 很 小 (如 P<0.05), 则 可 以 得 出 甲 药 优 于 乙 药 的 结论 。 不 
同类 型 的 数据 可 以 用 相应 的 统计 方法 作 分 析 , 如 :检验 .方差 分 析 、 妇 检验 、 相 关 性 分 析 多 元 回 
归 分 析 等 。 各 种 假设 检验 得 到 的 P 值 是 得 出 结论 的 主要 依据 。 























第 三 节 ”医学 统计 学 中 的 基本 概念 


~、 同 质 与 变异 
同 质 (homogeneity ) 是 指 根据 研究 目的 所 确定 的 观察 单位 其 性 质 应 大 致 相同 。 观 察 单 位 是 
人 饶 究 的 基本 单元 , 可 以 是 一 个 人 .一 个 地 点 .一 只 动物 .一 份 生物 样品 等 。 然 而 , 即使 性 质 相同 


第 一 章 绪 论 


的 事物 , 如 果 观 察 同 一 指标 , 各 观察 单位 之 间 由 于 存在 个 体 差异 , 也 会 使 测量 结果 不 同 , 这 种 差 
异 称 为 变异 (variation )。 医 学 研究 的 对 象 是 有 机 的 生命 体 , 其 机 能 十 分 复杂 , 不 同 的 个 体 在 相同 
的 条 件 下 ,对 外 界 环境 因素 可 以 产生 不 同 的 反应 。 例 如 , 同 种 族 、 同 年 龄 、 同 性 别 的 健康 人 , 在 
相同 的 条 件 下 测 其 脉搏 、 呼 吸 、 体 温 等 生理 指标 均 可 能 存在 很 大 的 差异 。 在 临床 治疗 中 ,用 同 
样 的 药物 治疗 病情 相同 的 病人 ,疗效 也 不 尽 相 同 。 即 使 在 相同 条 件 的 实验 室 里 ,不同 动物 之 间 
的 各 项 指标 也 有 明显 的 差异 。 变 异 是 生物 个 性 的 反映 , 若 所 研究 的 同 质 群体 中 所 有 个 体 完全 
相同 , 只 需 观察 任意 一 个 个 体 即 可 , 无须 使 用 统计 学 进行 研究 。 个 体 间 的 变异 来 源 于 一 些 未 加 
控制 或 无 法 控制 、 甚 至 不 明 因素 所 致 的 随机 波动 。 例 如 研究 儿童 的 身高 时 ,要求 性 别 、 年 龄 、 民 
族 、 地 区 等 影响 身高 较 大 的 、 易 控制 的 因素 要 相同 , 而 不 易 控制 的 遗传 、 营 养 等 影响 因素 则 可 以 

















学 统计 学 研究 的 对 象 是 有 变异 的 事物 , 因此 无 法 用 1~2 例 的 观测 结果 推论 出 一 般 规 
律 。 例 如 , 我 们 不 能 用 某 一 健康 成 人 的 红细胞 数 作为 一 般 健 康成 人 的 红细胞 数 ; 也 不 能 因为 使 
用 某 一 种 药物 治疗 一 合 冠 心病 患者 有 效 , 就 断定 这 种 药物 治疗 冠 心病 有 效 。 科 学 研究 工作 的 主 
要 任务 之 一 是 要 从 表现 为 偶然 性 的 大 量 数据 中 ,分 析出 其 中 必然 性 的 规律 , 而 统计 学 就 是 解决 
这 一 问题 的 有 效 工具 。 











二 、 变 量 与 数据 类 型 

变量 (variable ) 是 反映 实验 或 观察 对 象 生 理 、 生 化 、 解 剖 等 特征 的 指标 , 变量 的 观测 值 称 为 
数据 (data)。 例 如 , 体温 是 一 个 变量 , 它 随 着 时 间 的 变化 而 变化 , 也 会 因 个 体 的 差异 而 不 同 ; 身 
高 、 体 重 . 性 别 、 年 龄 ,血型 疗效 等 都 是 变量 , 它们 的 观测 值 称 为 数据 。 具 体 可 分 为 定量 数据 
(quantitative data )、 定 性 数据 (qualitative data ) 和 有 序数 据 (ordinal data ) 三 种 数据 类 型 。 

1. 定量 数据 ”也 称 计量 资料 。 变 量 的 观测 值 是 定量 的 , 其 特点 是 能 够 用 数值 大 小 衡量 其 
水 平 的 高 低 , 一 般 有 计量 单位 。 根 据 变量 的 取 值 特征 可 分 为 连续 型 数据 和 离散 型 数据 。 连 续 型 
定量 数据 具有 无 限 可 能 的 值 , 例如 身高 ,体重 血压 ,温度 等 。 离 散 型 定量 数据 通常 只 能 取 正 整 
数 , 例如 家 庭 成 员 数 、 脉 捕 、 白 细胞 计数 等 。 

2. 定性 数据 “也 称 计数 资料 。 变 量 的 观测 值 是 定性 的 , 表现 为 互 不 相 容 的 类 别 或 属性 。 
通常 情况 下 , 定性 数据 指 类 别 ( 属性 ) 之 间 没 有 程度 或 顺序 上 的 差别 , 它 可 以 进一步 分 为 二 分 类 
和 多 分 类 , 如 性 别 分 为 男 和 女 , 血型 分 为 A、B、O、AB 等 。 

3. 有 序数 据 也 称 半 定 基数 据 或 等 级 资料 。 变 量 的 观测 值 是 定性 的 , 但 各 类 别 (属性 ) 之 
间 有 程度 或 顺序 上 的 差别 , 如 尿 糖 的 化 验 结果 分 为 -、+、++、+++, 药物 的 治疗 效果 按照 显效 、 

统计 分 析 方法 的 选用 与 数据 类 型 有 密切 的 关系 。 根 据 分 析 的 需要 , 不 同类 型 的 变量 或 数据 
之 间 可 以 进行 转换 。 例 如 原始 的 血红 蛋白 为 定量 数据 , 如 果 将 血红 蛋白 分 为 正常 与 异常 两 类 ， 
则 可 以 根据 需要 按照 二 分 类 定性 数据 进行 分 析 ; 如 果 将 其 分 为 正常 、 轻 度 贫血 、 中 度 贫血 、 重 度 
贫血 四 个 等 级 时 , 则 可 以 根据 需要 按照 有 序数 据 进行 分 析 。 

三 、 总 体 和 样本 

总 体 (population ) 是 根据 研究 目的 确定 的 所 有 同 质 观察 单位 的 全 体 , 它 包 括 所 有 定义 范围 
内 的 个 体 变量 值 。 样 本 (sample ) 是 从 研究 总 体 中 抽取 部 分 有 代表 性 的 观察 单位 , 对 变量 进行 
观测 得 到 的 数据 。 例 如 , 在 特定 社区 中 随机 选取 200 名 成 年 男子 进行 体检 , 测 其 基本 的 生命 体 
征 : 身高 ,体重 .血压 、 脉 捕 ` 心 率 。 在 这 个 例子 中 , 有 5 个 变量 ,分 别 为 身高 .体重 、 血 奈 、 脉 捕 
和 心率 , 观察 单位 是 随机 抽取 的 每 个 成 年 男子 ; 如 果 感 兴趣 的 总 体 是 该 社区 的 全 部 成 年 男性 
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的 基本 生命 体征 ,那么 这 200 名 成 年 男子 的 5 个 变量 测量 结果 构成 了 样本 。 需 要 注意 的 是 , 研 
究 总 体 可 以 包括 无 限 的 个 体 , 例如 研究 尿 激 酶 原 治疗 心肌 梗死 的 疗效 , 这 里 总 体 同 质 的 基础 是 
有 心肌 梗死 的 患者 和 接受 尿 激酶 原 治疗 的 患者 , 没有 时 间 和 空间 的 限制 。 无 论 有 限 总 体 还 是 
无 限 总 体 , 我们 把 描述 总 体 特征 的 指标 称 为 参数 (parameter), 描述 样本 特征 的 指标 称 为 统计 量 
(statistie )。 为 了 保证 总 体 的 同 质 性 和 样本 的 可 靠 性 与 代表 性 , 应 当 严格 确定 总 体 范围 ,用 随机 
化 的 方法 选择 有 代表 性 的 样本 , 进行 正确 而 有 效 的 研究 设计 。 


四 . 误 差 


误差 (error) 是 指 观测 值 与 真实 值 、 样 本 统计 量 与 总 体 参数 之 间 的 差别 。 根 据 误 差 的 性 质 和 
来 源 主要 可 以 分 为 系统 误差 (systematic error)、 随 机 测量 误差 (random measurement error) 和 抽样 
误差 (sampling error ) 几 种 类 型 。 

1. 系统 误差 有 时 也 称 作 统计 偏 倚 。 系 统 误差 由 一 些 固 定 因素 产生 , 如 仪器 未 进行 归 零 
校正 、 标 准 试剂 校准 不 好 、 测 量 者 读 取 测量 值 不 准 、 试 验 对 象 选择 不 合适 、 医 生 对 疗效 标准 掌握 
偏 高 或 偏 低 等 原因 。 系 统 误差 的 大 小 通常 恒定 或 按照 一 定 规律 变化 , 具有 明确 的 方向 性 。 这 类 
误差 可 以 通过 周密 的 研究 设计 和 测量 过 程 标 准 化 等 措施 加 以 消除 或 控制 。 

2. 随机 测量 误差 ”在 测量 过 程 中 , 即使 仪器 初始 状态 及 标准 试剂 已 经 校正 , 但 由 于 各 种 偶 
然 因 素 的 影响 也 会 造成 同一 测量 对 象 多 次 测定 的 结果 不 完全 相同 , 这 种 随机 产生 的 误差 称 为 随 
机 测量 误差 。 实 际 中 , 产生 随机 测量 误差 的 主要 原因 是 生物 体 的 自然 变异 和 各 种 不 可 预知 因素 
产生 的 误差 , 这 种 误差 往往 没有 固定 的 大 小 和 方向 , 但 具有 一 定 的 统计 规律 (如 服从 正 态 分 布 )。 








| 随机 测量 误差 不 可 避免 , 但 可 以 通过 多 次 测量 获得 的 均 数 对 真实 值 进行 准确 的 估计 。 


3. 抽样 误差 ”抽样 误差 是 随机 误差 中 最 重要 的 一 种 误差 。 由 于 生物 的 个 体 变异 ,从 总 体 
中 随机 抽取 一 个 样本 进行 研究 ,所 得 样本 统计 量 与 相应 的 总 体 参 数 往往 不 相同 , 这 种 由 于 抽样 
而 引起 的 样本 统计 量 与 总 体 参数 问 的 差异 ,在 统计 学 上 称 为 抽样 误差 。 抽 样 误差 主要 来 源 于 个 


























| 体 的 变异 , 如 果 没 有 个 体 变异 , 就 不 存在 抽样 误差 。 抽 样 误差 可 以 用 统计 方法 进行 分 析 , 一 般 








来 说 ,样本 含量 越 大 , 则 抽样 误差 越 小 , 样本 统计 量 与 总 体 参 数 越 接近 。 

概率 (probability ) 是 描述 某 事件 发 生 可 能 性 大 小 的 度量 。 事 件 A 发 生 的 概率 可 以 写成 P(A)， 
其 取 值 范围 为 0<P(A)<1。P(A)=0 表示 该 事件 不 可 能 发 生 , P(A)=1 表示 该 事件 必然 发 生 。 
概率 也 可 以 用 稳定 的 频率 进行 解释 , 即 在 大 量 的 观察 或 试验 中 , 事件 A 出 现 的 相对 频率 。 如 某 
地 区 调查 了 20 000 名 成 年 人 的 高 血压 患 病情 况 ,结果 有 4000 人 患 病 , 估计 该 地 区 的 人 群 患 病 率 
为 20%; 若 从 该 地 区 随机 抽取 一 名 成 年 人 , 则 估计 该 对 象 患 有 高 血压 病 的 概率 为 20%。 医 学 数 


| 据 的 一 个 重要 特征 是 其 不 确定 性 , 这 种 不 确定 性 可 以 使 用 概率 表达 。 若 要 全 面 了 解 试验 , 则 必须 


知道 试验 的 全 部 可 能 结果 及 各 种 结果 发 生 的 概率 , 即 必须 知道 随机 变量 的 概率 分 布 (probability 
distribution ), 如 血型 的 分 布 。 

在 统计 学 上 ,统计 推断 的 结论 都 是 基于 一 定 概率 得 出 的 , 习惯 上 将 P<0.05 的 事件 称 为 小 概 
率 事 件 , 表示 在 一 次 试验 中 发 生 的 可 能 性 很 小 。 如 果 小 概率 事件 在 现实 中 出 现 , 就 要 追究 其 原 
因 。 如 对 两 种 药物 降 压 效果 的 差别 进行 假设 检验 , 由 于 抽样 误差 的 存在 , 无 论 两 种 药物 的 疗效 
是 否 有 差别 ,两 个 样本 均 数 之 间 总 会 存在 一 定 的 差异 , 这 种 差异 是 否 由 于 抽样 误差 造成 , 需要 








”通过 P 值 来 确定 。 如 果 P<0.05 则 说 明 当 前 试验 结果 显示 的 差别 是 由 于 “偶然 " 所 致 的 可 能 性 不 


足 5%, 因此 可 以 做 出 有 差别 的 结论 。 











6. 


E. 由 不 可 预知 的 偶然 因素 引起 的 误差 
抽样 误差 指 的 是 (。 ) 

A. 由 某 些 固定 的 因素 引起 的 误差 

C. 选择 样本 不 当 引 起 的 误差 

E. 由 不 可 预知 的 偶然 因素 引起 的 误差 








. 收集 数据 不 可 避免 的 误差 是 ( ) 


A. 随机 误差 
C. 过 失误 差 
E. 仪器 故障 误差 
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.统计 学 中 所 谓 的 总 体 通常 指 的 是 ( 。 ) 


A. 自然 界 中 的 所 有 研究 对 象 
C. 同 质 观察 单位 的 全 体 
E. 具有 代表 性 意义 的 数据 


. 统计 学 中 所 谓 的 样本 通常 指 的 是 ( ) 


A. 可 测量 的 生物 性 样品 
C. 某 一 变量 的 测量 值 
E. 总 体 中 有 代表 性 的 部 分 观察 单位 


10， 医 学 研究 中 抽样 误差 的 主要 来 源 是 人 


A. 测量 仪器 不 够 准确 
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练习 题 

一 、 单 项 选择 题 

1. 医学 统计 学 研究 的 对 象 是 (  ) 
A. 医学 中 的 小 概率 事件 B. 各 种 类 型 的 数据 
C. 动物 和 人 的 本 质 D. 有 变异 的 医学 事物 
E. 疾病 的 预防 与 治疗 

2. 用 样本 推论 总 体 , 具有 代表 性 的 样本 通常 指 的 是 ( ) 
A. 总 体 中 最 容易 获得 的 部 分 个 体 B. 在 总 体 中 随意 抽取 的 任意 个 体 
C. 挑选 总 体 中 的 有 代表 性 的 部 分 个 体 D. 用 方法 抽取 的 部 分 个 体 
E. 依照 随机 原则 抽取 总 体 中 的 部 分 个 体 

3. 下 列 观测 结果 属于 有 序数 据 的 是 ( ) 
A. 收缩 压 测 量 值 B. 脉 持 数 
C. 住院 天 数 D. 病情 程度 
E. 四 种 血型 

4. 随机 测量 误差 指 的 是 ( ) 
A. 由 某 些 固定 的 因素 引起 的 误差 B. 由 不 可 预知 的 偶然 因素 引起 的 误差 
C. 选择 样本 不 当 引 起 的 误差 D. 选择 总 体 不 当 引 起 的 误差 

| E. 由 操作 失误 引起 的 误差 

5. 系统 误差 指 的 是 ( ) 
A. 由 某 些 国定 的 因素 引起 的 误差 B. 由 操作 失误 引起 的 误差 
C. 选择 样本 不 当 引 起 的 误差 D. 样本 统计 量 与 总 体 参 数 间 的 误差 


. 由 操作 失误 引起 的 误差 
. 样本 统计 量 与 总 体 参 数 间 的 误差 


. 概括 性 的 研究 结果 
. 所 有 的 观察 数据 


. 统计 量 
. 数据 中 有 代表 性 的 一 部 分 


. 检测 出 现 错误 











笔记 





C. 统计 设计 不 合理 D. 生物 个 体 的 变异 

E. 样本 量 不 够 
二 、 简 答题 

1. 医学 统计 学 的 主要 作用 是 什么 ? 

2. 医学 统计 学 包括 哪些 基本 内 容 ? 

3. 统计 描述 与 统计 推断 的 主要 特点 是 什么 ? 

4. 统计 量 与 参数 的 差别 是 什么 ? 

5. 常见 的 三 类 误差 是 什么 ? 应 采取 什么 措施 和 方法 加 以 控制 ? 

6. 研究 尿 激酶 原 治疗 心肌 梗死 的 疗效 ,以 瑞 替 普 酶 作为 对 照 , 该 项 研究 共 包 含 几 个 
总 体 ? 











( 李 康 ) 


笔记 
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本 章 学 习 定量 数据 的 统计 描述 方法 。 这 一 部 分 的 内 容 主要 包括 频数 表 、 直 方 图 和 统计 指 
标 。 利 用 频数 表 和 直方 图 可 以 清楚 地 揭示 数据 的 分 布 类 型 和 特征 , 统计 指标 则 可 以 概括 性 地 描 
述 一 组 数据 的 集中 趋势 或 平均 水 平 。 学 习 这 些 方法 的 目的 在 于 能 够 有 效 地 组 织 、 整 理 和 表达 统 
计数 据 的 信息 。 


第 一 节 频数 分 布 


通过 实验 或 观察 等 各 种 方式 得 到 的 原始 数据 , 如 果 是 定量 数据 并 且 观 察 的 例 数 较 多 , 可 以 

对 数据 进行 分 组 , 然后 制作 频数 表 或 绘制 直方 图 , 用 以 显示 数据 的 分 布 规律 。 
一 、 频 数 表 

频数 表 ( frequency table ) 是 统计 表 的 一 种 , 它 同 时 列 出 观察 指标 的 可 能 取 值 区 间 及 其 在 各 区 
间 内 出 现 的 频数 。 具 体 做 法 : 先 根据 观察 个 体 的 数值 大 小 进行 分 组 , 然后 计算 每 组 中 观察 值 
出 现 的 次 数 。 由 于 这 种 数据 表达 方式 较 完整 地 体现 了 观察 值 的 分 布 规律 , 所 以 也 称 作 频数 分 
布 表 。 

在 编制 频数 表 时 , 通常 先 将 选 定 的 组 列 出 , 每 一 组 段 的 起 点 称 下 限 ,终点 称 上 限 ( 上 限 一 般 
不 列 出 ), 然后 将 原始 数据 归 到 不 同 的 组 段 中 , 最 后 计算 不 同 组 段 中 数据 的 个 数 , 即 可 得 到 各 组 
的 频数 。 

现 结合 实例 说 明 频 数 表 的 编制 方法 和 应 注意 的 问题 。 
例 2-1 某 地 用 随机 抽样 方法 检查 了 140 名 成 年 男子 的 红细胞 计数 , 检测 结果 如 表 2-1 所 示 。 














表 2-1 某 地 140 名 成 年 男性 红细胞 数 ( x 1012L ) 

476 526 561 B95 446 457 431 518 492 427 477 4.88 
500 473 447 534 470 481 493 504 440 527 463 5.50 
524 497 471 444 494 505 478 452 463 551 5.24 4.98 
433 483 456 54 479 491 426 438 487 499 560 4.46 
495 5.07 480 530 465 477 450 537 549 522 458 5.07 
481 454 [383 401 489 462 5I2 485 459 508 482 4.93 
5.05 440 414 501 437 524 460 471 482 494 505 4.79 
452 464 437 487 460 472 483 533 468 480 415 465 
476 488 461 3.97 408 4.58 431 405 416 504 5.15 © 4.50 
462 473 447 458 470 481 45 428 478 45!1 463 436 
448 459 509 520 532 505 441 452 464 475 449 422 
471 521 494 468 5.17 491 502 476 























1. 确定 组 数 ” 进 行 数据 分 组 时 首先 应 考虑 组 数 , 分 组 过 少 会 导致 信息 损失 较 大 ; 分 组 过 多 
则 可 能 使 数据 分 布 的 规律 性 不 能 明显 地 表示 出 来 。 通 常情 况 下 组 数 选择 在 8~15 之 间 , 以 能 显 
示 数 据 的 分 布 规律 为 宜 。 

2. 确定 组 距 分 组 时 必须 事先 规定 组 中 8， 组 距 的 宽度 按 相 邻 两 组 的 下 限 之 差 计 算 . 一 般 应 


7 








人 
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取 相 同 的 组 距 。 将 全 距 除 以 组 数 可 以 得 到 组 距 的 近似 值 。 全 距 即 数据 中 最 大 值 与 最 小 值 之 差 ， 
如 果 用 尺 表 示 全 距 ,上 表示 组 数 , 则 参考 组 距 为 Rk。 组 距 的 选择 应 符合 专业 习惯 ,得 到 参考 组 
距 后 再 结合 实际 情况 作 适 当地 调整 。 如 表 2-1 数据 中 的 最 大 值 为 5.95, 最 小 值 为 3.82, 全 距 为 
2.13, 现 拟 分 10 个 组 ,参考 组 距 为 


因为 通常 比较 习惯 含有 0.20 或 0.25 个 单位 倍数 的 区 间 宽 度 , 因此 可 以 在 0.20 和 0.25 两 种 
组 距 中 选择 。 若 用 0.20 作为 组 距 , 则 总 共有 11 个 区 间 ; 若 用 0.25 作为 组 距 , 则 有 9 个 区 间 。 权 
衡 后 选择 组 距 为 0.20 比较 合适 。 

有 些 资料 因为 数据 中 有 特大 或 特 小 的 数值 也 可 以 采用 不 等 组 距 , 如 某 些 食物 中 毒 的 潜伏 
期 ,大 部 分 在 短 时 间 内 出 现 症状 , 只 有 极 少 部 分 人 经 过 较 长 的 时 间 后 才 有 反应 , 这 种 情况 可 以 
将 后 面 的 一 些 组 段 作 适 当 的 合并 , 并 可 以 将 最 后 一 个 组 段 以 “大 于 …… ”表示 , 以 避免 出 现 一 些 
组 段 频数 为 零 的 情况 。 

3. 确定 组 限 “ 一 个 频数 分 布 必须 包括 整个 资料 范围 的 全 部 数据 , 即 一 个 数据 必须 能 够 归 
属于 某 一 组 , 同时 只 能 归属 于 一 个 组 , 不 能 兼 属 。 为 此 ， 实际 组 限 在 每 组 中 只 包含 下 限 而 不 包 
| 含 上 限 , 如 第 一 组 为 “3.80~”、 第 二 组 为 “4.00~”, 凡 小 于 4.00 者 均 应 分 人 第 一 组 , 达 4.00 者 则 在 
| 第 二 组 。 
4. 确定 频数 ”由 原始 数据 可 得 例 2-1 的 频数 表 , 如 表 2-2 所 示 。 


表 2-2 某 地 140 名 正常 男性 红细胞 计数 的 频数 表 











红细胞 数 ( x 10'3/L ) 组 中 值 频数 累积 频数 频率 (% ) 累积 频率 (% ) 
(1) (2) (3) (4) (5) (6) 
3.80~ 3.9 2 2 1.43 1.43 
4.00~ 4.1 6 8 4.29 5.71 
4.20~ 4.3 11 19 7.86 13.57 
4.40~ 4.5 25 44 17.86 31.43 
4.60~ 4.7 32 76 22.86 54.29 
4.80~ 4.9 27 103 19.29 73.57 
5.00~ 5.1 17 120 12.14 85.71 
5.20~ 5.3 13 133 9.29 95.00 
5.40~ pe 4 137 2.86 97.86 
5.60~ 57 2 139 1.43 99.29 
5.80~6.00 5.9 1 140 0.71 100.00 





`、 直方 图 

将 表 2-1 的 资料 编 成 频数 表 后 , 可 以 看 出 数据 的 分 布 情况 , 若 绘制 成 直方 图 (histogram ) 则 
更 直观 。 直 方 图 是 以 垂直 条 段 代 表 频 数 分 布 的 一 种 图 形 , 条 段 的 高 度 代 表 各 组 的 频数 , 由 纵 
| 轴 标 度 ; 各 组 的 组 限 由 横 轴 标 度 ,条 段 的 宽度 表示 组 距 。 如 将 表 2-2 资料 绘制 直方 图 ,如 图 2-1 
| 所 示 。 

从 图 2-1 明显 看 出 该 地 区 正常 成 年 男性 红细胞 数 的 分 布 特点 : 数据 多 集中 在 4.80 x 102/L 附 
近 , 两 侧 对 称 下 降 , 最 小 值 不 低 于 3.80 x 102/L, 最 大 值 不 超过 6.00 x 10 "7L。 绘 制 直方 图 的 频 
数 表 资料 一 般 为 等 距 分 组 , 对 于 不 等 距 资料 应 先 将 不 等 距 的 各 组 频数 折算 为 等 距 频数 , 然后 再 
作 图 。 
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频数 


站 3.8 40 42 44 46 48 5.0 52 5.4 5.6 5.8 6.0 


红细胞 数 (x 107D) 
2-1 140 名 正常 成 年 男性 红细胞 计数 的 直方 图 


三 、 频 数 分 布 表 的 用 途 

1. 作为 陈述 资料 的 形式 , 可 以 代 蔡 原始 资料 ,便于 进一步 分 析 。 

2. 便于 观察 数据 的 分 布 类 型 。 医 学 研究 中 常见 的 资料 分 布 类 型 可 分 为 对 称 分 布 和 偏 态 分 
布 两 大 类 。 在 对 称 分 布 资料 中 , 正 态 分 布 (normal distribution ) 是 一 种 非常 重要 的 分 布 类 型 , 其 特 
征 是 中 间 组 段 的 频数 最 多 , 两 侧 的 频数 分 布 对 称 , 并 按 一 定 的 规律 下 降 , 表 2-2 的 频数 分 布 即 近 
似 呈 正 态 分 布 (参见 图 2-1)。 如 果 频数 分 布 的 高 峰 向 左 偏 移 , 长 尾 向 右 侧 延伸 称 为 正 偏 态 分 布 ， 
相反 则 称 为 负 偏 态 分 布 。 在 统计 分 析 时 常 需要 根据 资料 的 分 布 形式 选择 相应 的 统计 分 析 方法 ， 
因此 对 数据 分 布 形式 的 判定 非常 重要 。 

3. 便于 发 现 资料 中 某 些 远 离 群体 的 特大 或 特 小 值 。 如 在 频数 表 中 连续 出 现 0 的 频数 后 , 又 
出 现 了 一 些 频数 就 值得 怀疑 , 应 进行 检查 和 核对 , 必要 时 可 通过 统计 检验 决定 取舍 。 

4. 当 样 本 含量 比较 大 时 , 可 用 各 组 段 的 频率 作为 概率 的 估计 值 。 如 表 2-2 第 (3) 栏 的 频数 
除 以 总 例 数 即 为 第 (5) 栏 的 频率 , 由 此 可 推测 成 年 男子 的 红细胞 计数 值 出 现在 各 组 段 的 概率 分 
别 为 0.014, 0.043 , 0.079,…, 0.007。 

总 之 , 通过 频数 分 布 表 和 直方 图 ,可 以 大 致 看 出 观察 资料 的 形态 和 特征 。 如 果 需 要 进一步 
用 数字 概括 、 明 确 地 描述 频数 分 布 的 特征 则 应 使 用 统计 指标 描述 的 方法 。 











二 节 ”集中 趋势 的 统计 指标 


平均 数 (average ) 是 描述 一 组 观察 值 集中 位 置 或 平均 水 平 的 统计 指标 , 它 常 作为 一 组 数据 的 

代表 值 用 于 分 析 和 进行 组 间 的 比较 。 平 均 数 有 多 种 ,常用 的 有 算术 均 数 、 几 何 均 数 和 中 位 数 等 。 
算术 均 数 

算术 均 数 (arithmetic mean ) 简 称 为 均 数 ,用 于 说 明 一 组 观察 值 的 平均 水 平 或 集中 趋势 , 是 描 
述 定量 数据 的 一 种 最 常用 的 方法 。 均 数 计算 有 直接 法 和 加 权 法 。 

(一 ) 直接 法 

将 所 有 的 观察 值 而 , 么 ,，… 刀 直接 相 加 再 除 以 观察 例 数 , 写成 公式 为 

过 -de 
n hn 
式 中 , 天 表示 样本 均 数 ;是 希腊 字母 ( 读 作 sigma), 表示 求 和 的 符号 ; n 为 样本 观察 例 数 。 如 对 
例 2-1 的 数据 用 上 面 公式 计算 , 可 算得 140 名 正常 成 年 男子 红细胞 数 的 均值 为 
4.76+5.26+5.61+…+5.02+4.76 
140 


(2-1) 





交 = 





=4.776(x10"/L) 


笔记 


笔记 
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(二 ) 加 权 法 

加 权 法 是 根据 频数 表 计 算 均 数 的 一 种 方法 。 当 观察 例 数 较 多 时 , 资料 通常 要 分 组 编 成 频数 
表 , 对 已 经 编 成 频数 表 的 资料 不 能 再 用 公式 (2-1) 计 算 , 这 种 情况 下 我 们 可 以 把 各 组 的 组 中 值 视 
为 各 组 观察 值 的 代表 值 , 分 别 乘 以 各 组 的 频数 得 到 各 组 观察 值 之 和 , 然后 将 它们 相 加 得 到 观察 
值 的 总 和 再 除 以 总 例 数 。 用 公式 表示 为 
St fr tt fh > 

n n 

式 中 上 表示 频数 表 的 组 段 数 ;所 , 记 ,…, 太 及 训 , 怠 ,… ,x 分 别 表示 1 至 组 的 频数 及 组 中 值 , 见 
表 2-2 第 (3) 栏 和 第 (2) 栏 ;组 中 值 =( 本 组 段 下 限 + 本 组 段 上 限 )/2, 如 "4.00~ 组 段 的 组 中 值 为 
(4.00+4.20)/2=4.10, 余 类 推 。 

将 表 2-2 的 数据 代入 公式 (2-2), 有 


无 = (2-2) 





2x3.90+6x4.10+11x4.30 +*…+2x5.70+1x5.90 
140 
由 此 可 见 , 在 样本 例 数 较 多 的 情况 下 ,加 权 法 与 直接 法 算得 的 结果 相差 不 大 。 
(三 ) 均 数 的 应 用 
均 数 的 意义 容易 理解 , 而 且 结果 也 比较 稳定 , 因而 应 用 极为 广泛 。 但 是 它 主要 适用 于 对 称 
分 布 或 偏 度 不 大 的 资料 , 尤其 适合 正 态 分 布 资料 。 由 于 在 计算 均 数 时 用 到 了 每 一 个 观察 值 , 在 


笔 三 =4.784(x10"°/L) 





| 偏 态 较 大 的 情况 下 ,算出 的 均值 容易 受到 频数 分 布 尾 端 极 大 或 极 小 值 的 影响 , 不 能 真正 地 反映 


分 布 的 集中 位 置 , 这 时 应 考虑 改 用 其 他 方法 。 
二 、 几 何 均 数 


医学 研究 中 有 一 类 比较 特殊 的 资料 , 如 抗体 滴 度 、 细 菌 计数 、 血清 凝集 效 价 ` 某 些 物质 浓度 
等 , 其 数据 特点 是 观察 值 间 按 倍数 关系 变化 ， 对 此 可 以 计算 几何 均 数 (geometric mean ) 以 描述 其 
平均 水 平 。 几 何 均 数 用 G 表 示 , 计算 公式 为 























G=/ 训 一 (2:3) 
即将 个 观察 值 连 乘 后 开 n 次 方 。 为 了 计算 方便 , 常 改 用 对 数 的 形式 计算 , 即 
Ge (ttle ye Ee] (2-4) 
n n 


可 以 看 出 ,几何 均 数 相当 于 各 观察 值 对 数 的 均值 再 取 反 对 数 。 对 于 频数 表 资 料 ,车 用 及,…， 


太 及 吉 , 吉 ,…, 训 分 别 表示 1 至 k 组 的 频数 及 各 组 中 位 取 值 , 则 几何 均 数 为 





G=lg (2 Ess] 二 (EE) (2-5) 
n 

例 2-2 测 得 10 个 人 的 血清 滴 度 的 倒数 分 别 为 2,2,4, 4,8, 8,8,8, 32, 32, 求 平均 滴 度 。 

如 果 计 算 均 数 , 其 值 为 Y=10.8, 现 计算 几何 均 数 为 : 





[和 | 
10 
显然 在 这 里 均 数 不 能 代表 其 平均 水 平 , 选择 几何 均 数 则 比较 合适 。 故 10 份 血清 注 度 的 平均 水 
A 

例 2-3 某 医师 使 用 胎盘 浸出 液 钩 端 螺旋 体 菌 苗 对 326 名 农民 接种 2 个 月 后 测 得 血清 lgG 
抗体 滴 度 见 表 2-3, 试 计 算 平 均 抗 体 滴 度 。 
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表 2-3 ”胎盘 浸出 液 钩 端 螺旋 体 菌 苗 接种 2 个 月 后 血清 9G 抗体 滴 度 











IgG 滴 度 倒数 & 例 数 | IgG 滴 度 倒数 例 数 
20 16 320 54 
40 57 640 25 
80 76 1280 23 
160 75 














Ba ell +54lg320 +25lg640 | i 
326 
即 胎盘 浸出 液 钩 端 螺旋 体 菌 苗 接 种 2 个 月 后 血清 IgG 抗体 的 平均 滴 度 为 1: 139。 
几何 均 数 在 医学 研究 领域 多 用 于 血清 学 和 微生物 学 中 。 有 些 明 显 呈 偏 态 分 布 的 资料 经 过 
对 数 变 换 后 呈 对 称 分 布 , 也 可 以 采用 几何 均 数 描述 其 平均 水 平 , 但 要 注意 观察 值 中 不 能 有 0 或 
负数 , 否则 在 作对 数 变换 之 前 需要 加 一 个 常数 。 同 一 组 观察 值 的 几何 均 数 总 是 小 于 它 的 算术 





三 、 中 位 数 和 百 分 位 数 

(一 ) 中 位 数 

将 一 组 观察 值 从 小 到 大 按 顺序 排列 总 < 总 <…< 世 ,居中 心 位 置 的 数值 即 为 中 位 数 (median )， 
记 为 M。 当 观察 例 数 n 为 奇数 时 , 中 位 数 是 按 顺序 排列 在 第 (n+1)/2 项 的 观察 值 ; 当 观察 例 
数 为 偶数 时 , 则 中 位 数 是 按 顺序 排列 在 第 n/2 项 和 第 (n/2)+ 1 项 之 间 , 即 该 两 项 的 平均 值 。 在 
全 部 观察 值 中 有 半数 的 值 比 M 大 , 另 有 半数 的 值 比 M 小。 例如 , 现 测 得 5 个 人 的 极 低 密度 脂 
蛋白 (VLDL ) 中 的 载 脂 B 蛋白 的 含量 (mmolL) 分 别 为 0.0095、0.0322、0.0617、0.0970 、0.1085， 
中 位 数 等 于 0.0617mmolL; 若 仅 测量 了 四 个 值 0.0095 、0.0322 .0.0617 、0.0970, 则 中 位 数 为 
(0.0322+0.0617)/2=0.0470(mmol/L)。 另外 也 可 以 根据 频数 表 资料 计算 中 位 数 。 下 面 通过 实例 
说 明 它 的 计算 方法 。 

例 2-4 对 某 地 630 名 50~60 岁 的 正常 女性 检查 了 血清 甘油 三 酯 含量 (mmolL ), 资料 如 
表 2-4 所 示 , 试 计算 其 中 位 数 。 








表 2-4 某 地 630 名 正常 女性 血清 甘油 三 酯 含量 (mmol/L ) 的 频数 表 

















甘油 三 酯 频数 累积 频数 累积 频率 (% ) 
(1) (2) (3) (4) 
0.10~ 27 27 4.29 
0.40~ 169 196 31.11 
0.70~ 167 368 57.62 
1.00~ 94 457 72.54 
1.30~ 81 538 85.40 
1.60~ 42 580 92.06 
1.90~ 28 608 96.51 
2.20~ 14 622 98.73 
2.50~ 4 626 99.37 
2.80~ 3 2 99.84 
3.10~ 1 630 100.00 
会计 630 a TT 





笔记 


垢 
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计算 频数 分 布 中 位 数 的 第 一 步 是 确定 它 所 在 区 间 的 位 置 。 资 料 总 例 数 是 630, 其 50% 是 
315, 当 观察 值 按 顺 序 排列 时 , 第 315 个 观察 值 就 是 中 位 数 M( 近 似 计算 )。 从 累积 频数 分 布 可 以 
看 出 ,第 315 个 观察 值 处 于 [ 0.70, 1.00) 区 间 内 ,第 (4) 栏 的 累积 频率 则 更 清楚 地 显示 了 它 所 在 
的 区 间 。 假 定 该 区 间 内 的 观察 值 呈 均匀 分 布 , 因为 在 此 区 间 之 前 有 196 例 , 在 区 间 内 共有 167 
例 , 所 以 可 以 推 想 , 中 位 数位 于 该 区 间 内 离 下 限 的 距离 为 该 区 间 宽 度 的 (315 一 196)/167 处 。 为 
了 得 出 中 位 数 的 值 , 可 将 (315 一 196)/167 乘 以 区 间 宽 度 0.30, 再 将 此 乘积 项 加 到 所 属 区 间 的 下 
限 上 去 (参见 图 2-2 )。 于 是 有 : 


M=0.70 站 x 0.30 =0.914 (mmol/L) 


一 般 , 可 用 以 下 公式 计算 中 位 数 


0.5n—f, |. 
Mo 2 (2-6) 
式 中 , 工 为 M 所 在 组 段 的 下 限 , iy 为 组 距 , fi 为 频数 ,fi 为 之 前 各 组 段 的 累积 频数 。 
180 
150 
120 
长 % 








30 
0 [1 
0.1 04 .07 1.0 13 1.6 19 22 25 2.8 3.1 
196 
630x0.5| M 甘油 三 酯 mmol/D) 


图 2-2 中 位 数 计算 方法 示意 图 

(二 ) 百 分 位 数 

中 位 数 可 以 用 来 描述 一 组 观察 值 的 中 心 位 置 。 但 有 时 我 们 还 需要 了 解数 据 分 布 的 其 他 位 
置 , 如 资料 分 布 的 左 侧 占 全 部 观察 值 25% 的 位 置 ,这 时 可 以 通过 计算 百 分 位 数 (percentile ) 确 
定 。 百 分 位 数 用 符号 忆 表示 ,x 表示 百 分 位 , 所 谓 百 分 位 数 已 是 指 在 一 组 数据 中 找到 这 样 一 个 
值 , 全 部 观察 值 的 x% 小 于 已 , 其 余 (100-x)% 大 于 P.。 如 Ps 表示 资料 在 Ps 位 置 左 侧 的 累积 
频数 占 总 数 的 25%, 右 侧 占 75%。Ps 实际 就 是 中 位 数 M。 百 分 位 数 的 计算 原理 与 中 位 数 完全 
相同 ,对 式 (2-6) 只 需 将 中 位 数 换 成 任意 百 分 位 数 , 即 





式 中 , 工 为 P. 所 在 组 段 的 下 限 ,i 为 组 距 ,大 为 频数 ,fi 为 P. 所 在 组 段 之 前 各 组 段 的 累积 频数 。 
需要 注意 : 根据 频数 表 数 据 计算 出 的 百 分 位 数 已 是 近似 值 , 实际 计算 中 可 以 由 计算 机 直接 
根据 原始 数据 求 出 其 准确 值 。 
例 2-5 计算 例 2-4 的 百 分 位 数 Ps、Pys、P。 
利用 公式 (2-7), 可 分 别 求 得 : 
记忆 040+ 一人 x0.30 =0.632 (mmoV/L) 


Ps, =1.30+ 人 x0.30 =1.357 (mmol/L) 
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P, =1.60 下 x 0.30 =1.807 (mmoV/L) 

(三 ) 中 位 数 和 百 分 位 数 的 应 用 

1. 中 位 数 与 均 数 、 几 何 均 数 的 作用 相同 , 都 能 用 来 反映 一 组 数据 的 集中 趋势 或 平均 水 平 。 
由 于 中 位 数 的 确定 仅 取决 于 它 在 数据 序列 中 的 位 置 , 而 不 是 由 全 部 观察 值 综合 计算 得 出 , 因 
此 不 受 少数 特大 或 特 小 值 的 影响 , 在 这 一 点 上 它 优 于 均 数 。 一 般 来 说 , 在 频数 分 布 呈 明显 偏 
态 或 频数 分 布 的 两 端 无 确定 数值 时 , 使 用 中 位 数 描述 集中 趋势 或 平均 水 平 较为 合理 。 当 变量 
呈 对 称 分 布 时 , 理论 上 中 位 数 和 均 数 相同 。 但 对 于 样本 资料 , 由 于 计算 均 数 时 利用 了 所 有 的 
观察 值 , 所 以 较 中 位 数 稳定 。 另 外 , 中 位 数 还 有 一 个 很 大 的 缺点 , 即 不 便于 作 统 计 运算 , 如 根 





据 两 组 资料 的 不 同 中 位 数 无 法 算出 合并 的 中 位 数 。 因 此 在 统计 分 析 中 , 中 位 数 不 如 均 数 应 用 | 


广泛 。 
2. 百 分 位 数 可 以 用 来 描述 资料 的 观察 值 序列 在 某 百 分 位 置 的 水 平 , 中 位 数 是 其 中 的 一 个 


特例 。 多 个 百 分 位 数 结合 使 用 常 可 以 用 来 说 明 某 一 特定 的 问题 , 如 用 Ps 和 Pis 描述 资料 的 分 | 


散 程度 ,用 Ps 和 Pos 规定 医学 95% 的 参考 值 范围 ; 在 研究 青少年 生长 发 育 时 用 百 分 位 数 ( Ps， 


Pss, Pxs, Pu) 划分 等 级 等 。 百 分 位 数 可 用 于 任何 频数 分 布 的 资料 , 但 靠近 两 端的 百 分 位 数 仅 在 


样本 例 数 较 大 时 才 比 较 稳定 (如 za> 100)。 


第 三 节 ”变异 程度 的 统计 指标 


实际 中 , 除 要 了 解 观察 值 的 平均 水 平 外 , 往往 还 需要 同时 了 解 这 些 观察 值 之 间 的 变异 程度 
或 偏离 集中 位 置 的 程度 。 为 了 说 明 这 一 问题 , 看 下 面 的 例子 。 
例 2-6 对 甲乙 两 名 高 血压 患者 连续 观察 5 天, 测 得 的 收缩 压 分 别 如 下 : 
甲 患者 (mmHg) 162 145 178 142 186 (Xw=162.6) 
乙 患者 (mmHg) 164 160 163 159 166 (XX¥,=162.4) 
从 列 出 的 数据 可 以 看 出 , 两 人 收缩 压 的 均 数 几乎 没有 差别 , 但 甲 患者 的 血压 波动 比较 大 ， 








而 乙 患 者 相对 比较 稳定 。 因 此 , 描述 一 组 观察 值 , 除 需要 表示 其 平均 水 平 外 , 还 要 说 明 它 的 变 | 


异 情况 。 
衡量 变异 程度 大 小 的 指标 有 多 种 , 但 大 体 可 以 分 为 两 类 : 一 类 是 按 间距 计算 , 有 极 差 和 四 
分 位 数 间距 ; 另 一 类 则 按 平 均 差距 计算 ,有 方差 标准 差 和 变异 系数 等 。 
极 差 (range) 也 称 作 全 距 , 即 观察 值 中 最 大 值 和 最 小 值 之 差 , 用 符号 R 表示 , 是 变异 指标 中 
最 简单 的 一 种 。 极 差 大 说 明 变异 程度 大 , 反之 说 明 变 异 程度 小 , 如 例 2-6 中 甲乙 两 患者 收缩 压 
的 极 差分 别 为 
Rin=186—142=44(mmHg) 
Rz=166-159=7(mmHg) 
可 见 甲 患 者 收缩 压 的 波动 大 , 乙 患 者 波动 小 。 
极 差 的 方法 虽然 简单 , 但 在 某 些 场合 颇 有 实用 价值 , 如 用 于 说 明 传染 病 、 食 物 中 毒 等 的 最 
短 、 最 长 潜伏 期 等 。 用 极 差 说 明 数 据 分 布 的 离散 程度 ,简单 明了 、 容 易 使 用 , 但 由 于 计算 时 仅 用 
到 了 最 大 值 和 最 小 值 , 而 没有 利用 观察 值 中 的 全 部 信息 , 随 着 观察 例 数 的 增多 , 抽 到 较 大 或 较 
小 数值 的 可 能 性 越 来 越 大 , 极 差 也 会 随 之 而 变 大 , 尤其 当 资 料 呈 明显 偏 态 分 布 时 会 显得 更 加 不 
稳定 ,所 以 极 差 通常 仅 用 于 粗略 地 说 明 变 量 的 波动 范围 。 





3 


学 


毛 , 


i 


| 例如 对 于 例 2-6 有 
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二 、 四 分 位 数 间距 


极 差 不 稳定 主要 受 观察 值 中 两 端 极端 数值 的 影响 , 如 果 将 两 端的 数据 去 掉 一 定 的 比例 , 所 得 
到 的 结果 就 会 比较 稳定 。 一 种 方法 是 把 所 有 的 观察 值 排序 后 , 分 成 四 个 数目 相等 的 段落 , 每 个 段 
落 的 观察 值 数 目 各 占 总 例 数 的 25%, 去 掉 两 端的 25%, 取 中 间 50% 观察 值 的 数据 范围 即 为 四 分 
位 数 间距 (quartile range)。 四 分 位 数 间距 用 符号 O 表示 , 它 可 以 通过 计算 百 分 位 数 Ps 和 Ps 之 差 
得 到 , 即 Q=Pys 一 Ps。 例 如 由 上 一 节 例 2-4 算出 , 50~60 岁 正常 女性 血清 甘油 三 酯 含量 的 百 分 位 
数 Ps 和 Ps 的 位 置 分 别 为 0.632mmoyL 和 1.357mmolL, 8=1.357 一 0.632=0.725(mmol/L), 说 明 有 
50% 的 女性 甘油 三 酯 在 0.632mmol/L 和 1.357mmol/L 之 间 , 其 四 分 位 数 间 距 为 0.725mmol/L。 四 


| 分 位 数 间距 越 大 , 说 明 数据 的 变异 越 大 ; 反之 , 四 分 位 数 间距 越 小 说 明 变 异 越 小 。 


用 四 分 位 数 间距 作为 说 明 个 体 差异 的 指标 , 与 极 差 相 比 不 易 受 极端 值 的 影响 , 但 仍 未 用 到 
每 一 个 具体 的 观察 值 , 在 统计 分 析 中 应 用 不 够 普遍 。 
E 闫 
为 了 利用 每 一 个 观察 值 的 信息 , 可 以 计算 各 观察 值 偏离 平均 数 的 平均 差距 ,为 了 避免 正 负 
抵消 ,将 每 个 观察 值 与 均 数 之 差 的 绝对 值 相 加 ,然后 取 平 均 , 即 计算 立 |X- 刀 |/m 这 是 一 个 很 
直观 的 变异 量度 ,但 由 于 用 了 绝对 值 , 在 数学 上 不 便于 处 理 。 为 此 可 以 通过 取 平 方 来 避免 正 负 
抵消 , 即使 用 方差 (variance ) 衡 量 数据 的 变异 程度 , 其 计算 公式 为 
区 = (2-8) 


= 








| 其 中 ， 分 子 >,(X 一 凶 7 称 为 离 均 差 平方 和 (sum of squares), 它 描述 了 每 个 观测 值 相对 于 集中 位 
| 置 蕊 的 分 散 程度 。 通 过 推导 可 化 为 下 式 


DC Fe (C233 
n 
式 (2-8) 的 分 母 n 一 1 称 为 自 由 度 (degree of freedom , 简写 为 47)， 它 表 示 在 所 有 的 个 离 均 差 平方 
项 中 , 由 于 样本 均 数 无 的 限制 ,只 有 n 一 1 个 离 均 差 平方 和 是 独立 的 。5? 为 样本 方差 (总 体 方差 
用 表示 ), 其 值 越 大 说 明 数 据 的 变异 越 大 。 
四 . 标 准 差 
方差 是 用 取 平 方 后 的 单位 来 表示 的 , 如 果 血 压 的 原始 数据 用 毫米 未 柱 表示 , 则 方差 就 是 毫 
米 未 柱 的 平方 。 在 统计 分 析 中 为 了 方便 , 通常 将 方差 取 平方 根 ， 还 原 成 与 原始 观察 值 单位 相同 


的 变异 量度 , 其 计算 公式 为 
RE PA (2-10) 
n—l 


5 称 为 标准 差 (standard deviation), 有 时 也 记 为 SD。 显 然 , 一 组 观察 值 的 标准 差 越 大 说 明 其 





| 变异 程度 越 大 。 将 式 中 的 离 均 差 平方 和 展开 , 标准 差 也 可 写 为 


Se Pd NE (2-11) 
=] 


甲 患 者 : DX=162+145+178+142+186=813 


DL X=162+145+178"+1427+186’=133713 
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133 713—813*/5 
S= i 19.49( mmHg) 


乙 患 者 : > X=164+160+163+159+166=812 


2 X=164+160+163’+159+166’=131902 


[131902—8122/5 
S= 一 -288(mmHg) 


说 明 甲 患者 血压 波动 比 乙 患 者 血压 波动 大 。 
如 果 是 频数 表 资 料 , 可 用 如 下 公式 计算 


5- AOA/n (2-12) | 
nm} | 


式 中 x 和 /分 别 为 各 组 段 的 组 中 值 及 出 现 的 频数 。 | 
例 2-7 ”根据 第 一 节 表 2-2 的 频数 表 资料 , 计算 成 年 男子 红细胞 数 的 标准 差 。 计 算 结 果 如 下 : 


表 2-5 140 名 正常 成 年 男子 红细胞 计数 ( x 10?2/L ) 的 标准 差 计算 表 














红细胞 计数 组 中 值 (x) 频数 (用 fx fe 
(1 (2) (3) (4) C5) 
3.80~ 3.90 2 7.80 30.42 
4.00~ 4.10 6 24.60 100.86 
4.20~ 4.30 二 47.30 203.39 
4.40~ 4.50 25 112.50 506.25 | 
4.60~ 4.70 32 150.40 706.88 | 
4.80~ 4.90 祈 132.30 648.27 
5.00~ 5.10 17 86.70 442.17 
5.20~ 5.30 13 68.90 365.17 
5.40~ 5.50 4 22.00 121.00 
5.60~ 5.70 2 11.40 64.98 | 
5.80~6.00 5.90 1 5.90 34.81 | 
合计 140 669.80 3224.20 





由 公式 (2-12 ) 得 出 ， 


[3224.20 一 669.8021140 
$= 0 0 10™L) 


即 所 求 标准 差 为 0.38 x 10™L。 

在 变异 指标 中 ,标准 差 或 方差 是 其 他 变异 指标 所 不 能 比拟 的 。 标 准 差 能 够 直接 用 于 代数 运 
算 , 如 根据 来 自 同一 总 体 的 几 个 样本 的 标准 差 , 可 以 直接 求 得 合并 样本 的 标准 差 , 而 不 必 根 据 
合并 样本 重新 计算 。 更 为 重要 的 是 , 标准 差 与 正 态 分 布 有 明确 的 关系 , 它 与 均 数 结合 能 够 完整 
地 概括 一 个 正 态 分 布 。 


及、 变异 系数 
标准 差 与 原始 数据 的 量 纲 相同 , 在 两 组 数据 的 均 数 相差 不 大 、 单 位 相同 时 , 从 标准 差 的 大 
小 就 可 以 直接 比较 两 个 样本 的 变异 程度 。 但 是 ,有 了 时 我 们 需要 对 均 数 相差 较 大 或 单位 不 同 的 几 
组 观察 值 的 变异 程度 进行 比较 , 这 时 使 用 标准 差 就 不 再 适宜 。 在 这 种 情况 下 可 以 使 用 变异 系数 
( coefficient of variation, 简 记 为 CV), 其 计算 公式 为 








笔记 
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CV = 人 Sx100% (2-13) 
xX 


例 2-8” 测 得 某 地 成 年 人 舒张 压 的 均 数 为 77.5mmHg, 标准 差 为 10.7mmHg; 收缩 压 的 均 数 为 
122.9mmHg, 标准 差 为 17.1mmHg。 试 比较 舒张 斥 和 收缩 压 的 变异 程度 。 

舒张 压 和 收缩 压 是 两 个 不 同 的 指标 , 尽管 单位 相同 , 但 均 数 相差 较 大 , 如 直接 比较 两 个 标 
准 差 , 会 得 出 收缩 压 变异 较 大 的 结论 。 现 计算 两 者 的 变异 系数 








10. 
舒张 压 CV= 过 100%=13.81% 
Ts 
收缩 压 C= Lb 100%=13.91% 
村 SS 122.9 0 . 0 


可 见 两 种 指标 的 变异 程度 几乎 没有 什么 差别 。 





练习 题 

一 、 单 项 选择 题 

1. 某 医 学 资料 数据 大 的 一 端 没有 确定 数值 , 描述 其 集中 趋势 适用 的 统计 指标 是 ( ) 
A. 中 位 数 B. 几何 均 数 
C. 均 数 D. Py 百 分 位 数 


2. 算术 均 数 与 中 位 数 相 比 , 其 特点 是 ( ) 
A. 不 易 受 极端 值 的 影响 B. 能 充分 利用 数据 的 信息 
C. 抽样 误差 较 大 D. 更 适用 于 偏 态 分 布 资料 
E. 更 适用 于 分 布 不 明确 资料 

3. 将 一 组 计量 资料 整理 成 频数 表 的 主要 目的 是 (。 ) 


A. 化 为 计数 资料 B. 便于 计算 
C. 提供 原始 数据 D. 为 能 够 更 精确 地 检验 


E. 描述 数据 的 分 布 特征 
4. 6 人 接种 流感 疫苗 一 个 月 后 测定 抗体 滴 度 为 1:20、1:40、1:80、1:80、1:160、1:320, 求 
平均 滴 度 应 选用 的 指标 是 ( ) 








A. 均 数 B. 几何 均 数 
C. 中 位 数 D. 百 分 位 数 
E. 倒数 的 均 数 
5. 变异 系数 主要 用 于 ( ) 
A. 比较 不 同 计量 指标 的 变异 程度 B. 衡量 正 态 分 布 的 变异 程度 
C. 衡量 测量 的 准确 度 D. 衡量 偏 态 分 布 的 变异 程度 


E. 衡量 样本 抽样 误差 的 大 小 
6. 对 于 正 态 或 近似 正 态 分 布 的 资料 , 描述 其 变异 程度 应 选用 的 指标 是 ( ) 


A. 变异 系数 B. 离 均 差 平方 和 
C. 极 差 D. 四 分 位 数 间距 


E. 标准 差 
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7. 已 知 动 脉 硬化 患者 载 脂 蛋白 B 的 含量 (mg/dl) 呈 明显 偏 态 分 布 ,描述 其 个 体 差异 的 统计 
指标 应 使 用 (。 ) 
A. 全 距 B. 标准 差 
C. 变异 系数 D. 方差 
E， 四 分 位 数 间距 
8. 一 组 原始 数据 的 分 布 呈 正 偏 态 分 布 , 其 数据 的 特点 是 (  ) 


A. 数值 离散 度 大 B. 数值 离散 度 小 
C. 数值 偏向 较 大 的 方向 D. 数值 偏向 较 小 的 方向 


E. 数值 分 布 不 均匀 
9. 对 于 正 偏 态 分 布 总 体 ,其 均 数 与 中 位 数 的 关系 是 (。” ) 
A. 均 数 与 中 位 数 相同 B. 均 数 大 于 中 位 数 
C. 均 数 小 于 中 位 数 D. 两 考 有 一 定 的 数量 关系 
E. 两 者 的 数量 关系 不 定 
10. 在 衡量 数据 的 变异 度 时 , 标准 差 与 方差 相 比 , 其 主要 特点 是 (  ) 


A. 标准 差 小 于 方差 B. 标准 差 大 于 方差 
C. 标准 差 更 容易 计算 D. 标准 差 更 为 准确 


E. 标准 差 的 计量 单位 与 原始 数据 相同 
二 、 计算 与 分 析 
1. 现 测 得 10 名 乳腺 癌 患 者 化 疗 后 血液 尿素 氮 的 含量 (mmol/L) 分 别 为 3.43, 2.96， 
4.43,3.03, 4.53, 5.25, 5.64, 3.82, 4.28, 5.25, 试 计算 其 均 数 和 中 位 数 。 
2. 某 地 100 例 30~40 岁 健康 男子 血清 总 胆固醇 值 (mg/dl) 测 定 结果 如 下 : 
202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 
228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 
159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 
221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 
234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156 
(1) 编制 频数 分 布 表 并 画 出 直方 图 ; 
(2) 根据 频数 表 计 算 均值 和 中 位 数 , 并 说 明 用 哪 一 个 指标 比较 合适 ; 
(3) 计 算 百 分 位 数 Pi Pss、Pys、Pys 
3. 测 得 10 名 肝癌 病人 与 16 名 正常 人 的 血清 乙 型 肝炎 表面 抗原 (HBsAg) 滴 度 如 下 表 ， 
试 分 别 计算 它们 的 平均 滴 度 


肝癌 病人 与 正常 人 的 血清 乙肝 表面 抗原 ( HBsAg ) 滴 度 





滴 度 倒数 , 正常 人 数 肝癌 病人 数 
8 ph 1 
16 局 2 
32 1 3 
64 3 2 
128 0 1 
256 0 1 











笔记 
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4. 下 表 为 10 例 生体 催乳 素 微 腺 瘤 的 病人 手术 前 后 的 血 众 乳 素 浓 度 , 试 说 明 用 何 种 指 
标 比较 手术 前 后 数据 的 变异 情况 较为 合适 。 











手术 前 后 患者 血 催乳 素 浓 度 
局 血 催乳 素 浓 度 ( ng/ml) 

术 前 术 后 
1 276 41 
2 880 110 
3 1600 280 
4 324 61 
5 398 105 
6 266 43 
7 500 25 
8 1760 300 
9 500 215 
10 220 92 























正 态 分 布 是 自然 界 中 最 常见 、 最 重要 的 一 种 连续 型 分 布 , 是 后 面 将 要 学 习 的 各 种 统计 推断 
方法 的 理论 基础 。 在 医学 中 , 有 很 多 生理 生化 指标 服从 或 近似 服从 正 态 分 布 , 如 同性 别 健康 成 
年 人 的 身高 体重 , 红细胞 计数 和 血红 蛋白 含量 等 。 在 变量 服从 正 态 分 布 情况 下 , 可 以 很 容易 


地 确定 其 数值 出 现在 任意 指定 范围 内 的 概率 , 特别 是 可 以 应 用 于 医学 参考 值 范围 的 估计 。 


第 一 节 


正 态 分 布 (normal distribution ) 首 先 由 德国 数学 家 和 天 文学 家 德 . 莫 阿 弗 尔 (A.de Moiver， 
1667 一 1754) 于 1733 年 提出 。 德 国 数学 家 高 斯 (Gauss, 1777 一 1855 ) 虽 然 发 现 稍 晚 , 但 他 迅速 将 
正 态 分 布 应 用 于 天 文学 , 并 对 其 性 质 作 了 进一步 的 研究 , 使 了 


正 态 分 布 


此 , 正 态 分 布 又 称 为 高 斯 分 布 (Gaussian distribution )s 
一 、 正 态 曲 线 





医学 研究 中 许多 变量 的 频数 分 布 以 均 数 为 中 心 , 表现 为 越 接 近 均 数 频数 分 布 越 多 , 离 均 数 
越 远 频数 分 布 越 少 , 且 左右 两 侧 基本 对 称 。 由 第 二 章 图 2-1 可 见 , 140 名 了 


计数 的 频数 分 布 就 是 以 均 数 为 中 心 , 左 
右 基 本 对 称 的 。 若 将 图 2-1 的 纵 轴 由 表 
2-2 中 的 频数 转换 为 频率 , 即 可 得 到 140 
名 正常 成 年 男子 红细胞 计数 的 频率 分 布 
图 (图 3-1), 虽然 两 个 图 的 纵 坐标 含义 
各 异 , 但 图 的 形状 却 完全 相同 。 可 以 设 
想 , 随 着 观察 人 数 的 逐渐 增多 , 组 段 不 
断 细 分 , 图 3-1 中 的 直 条 将 逐渐 变 罕 , 其 
顶端 中 点 连 线 越 来 越 近 似 一 条 均匀 连 
续 的 光滑 曲线 (图 3-2)。 图 3-2 中 曲线 
的 横 轴 表示 测量 指标 X, 纵 轴 表 示 概 率 
密度 函数 (probability density function ) 
XX),AX)=(fi1n)/AXi,fi 和 AXi 分 别 表 
示 第 i 组 的 频数 和 组 距 ,n 表示 总 例 数 ， 
则 图 中 各 直 条 的 面积 恰好 等 于 各 自 组 段 
的 频率 (AX.AX)=fi1n)。 在 例 数 较 大 的 
现 为 中 间 高 , 两 边 低 , 左右 对 称 , 略 呈 钟 
形 , 则 近似 于 数学 上 的 正 态 曲线 (normal 
curve), 在 处 理 资料 时 ， 可 把 它 看 作 是 正 
态 分 布 。 


频率 (%) 


3.8 








4.2 4.6 5.0 5.4 
红细胞 计数 (x 10™/D) 


3-1 ”频率 分 布 图 示意 图 


E 态 分 布 的 应 用 价值 广为人知 , 因 


E 常 成 年 男子 红细胞 


5.8 





图 3.2 ”概率 密度 曲线 示意 多 























笔记 
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二 、 正 态 分 布 的 特征 
如 果 随 机 变量 无 的 分 布 服从 概率 密度 函数 





1 2 
> 0 RE -co< 歼 <+co) (C351 
ff) a ( 
1 _ ix 9 
V6 0 | er /dx (-co<X<+co) (3-2) 
CAW2F = 


称 连 绪 型 随机 变量 服从 正 态 分 布 , 记 为 X-N(1, 7), 式 中 t 和 是 两 个 常数 ,分 别 为 园 周 率 
(x=3.141 592……: ) 和 自然 对 数 的 底 值 (e 近似 等 于 2.718 28 ),/ 和 c 为 正 态 分 布 的 两 个 参数 , 其 
中 j 为 XX 的 总 体 均 数 ,为 XX 的 总 体 方差 ,X 的 取 值 范围 理论 上 没有 边界 (<X<+oo)， X 离 4 
越 远 , 函数 AX) 值 越 接近 于 0, 但 不 会 等 于 0。 

正 态 分 布 具 有 如 下 几 个 主要 特征 : 

1. 正 态 分 布 是 单 峰 分 布 ,以 X=4 为 中 心 , 左右 完全 对 称 , 正 态 曲线 以 X 轴 为 渐 近 线 , 两 端 
与 XX 轴 不 相交 。 

2. 正 态 曲 线 在 X= 处 有 最 大 值 , 其 值 为 /do) =1/(oV27); XX 越 远 离 1,AX) 值 越 小 ,在 
| X=4+to 处 有 拐点 ,呈现 为 钟 形 。 
| “3. 正 态 分 布 完全 由 两 个 参数 人 和 决定 ,人 是 位 置 参 数 ,描述 正 态 分 布 的 平均 水 平 , 决 定 着 
正 态 曲线 在 X 轴 上 的 位 置 ; c 是 形状 参数 , 描述 正 态 分 布 的 变异 程度 , 决定 着 正 态 曲 线 的 分 布 形 
| 状 。 若 固定 而 改变 w, 曲线 沿 着 X 轴 平 行 移动 ， 
其 形状 不 变 , 改变 的 只 是 位 置 (图 3-3); 车 4 固定 
| 而 改变 o,o 越 大 曲线 越 “ 矮 胖 ”, 表示 数据 越 分 散 
即 变异 越 大 , o 越 小 曲线 越 “ 瘦 高 ”, 表示 数据 越 集 











中 即 变异 越 小 (图 3-4)。 因 此 ,不 同 的 w 与 不 同 的 3 4 
5 对 应 不 同 的 正 态 分 布 。 图 3-3， 正 态 分 布 位 置 参数 变化 示意 图 (c= 1) 





4 0 1 太 


3-4 ” 正 态 分 布 形状 参数 变化 示意 图 (4=0) 


4. 正 态 曲线 下 的 面积 分 布 有 一 定 的 规律 。 人 曲线 下 的 面积 即 为 概率 , 可 通过 式 (3-2 ) 求 
得 , 服从 正 态 分 布 的 随机 变量 在 某 一 区 间 上 的 曲线 下 面积 与 该 随机 变量 在 同一 区 间 上 的 概率 相 
等 (图 3-5); 四 曲线 下 的 总 面积 为 1 或 100%, 以 4 为 中 心 左右 两 侧面 积 各 占 50% , 越 靠近 处 曲 
线 下 面积 越 大 , 两 边 逐 渐 减 少 ; @ 所 有 正 态 曲线 , 在 p 左右 的 任意 个 标准 差 范围 内 面积 相同 : 区 
间 jto 范围 内 的 面积 约 为 68.27%, 区 间 /+1.64c 范围 内 的 面积 约 为 90.00%, 区 问 / 士 1.96c 范 
围 内 的 面积 约 为 95.00%, 区 间 w+2.58c 范围 内 的 面积 约 为 99.00%( 图 3-6)。 
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| 
AK-2.580 4K—1.960 Ls a oid H+1.960 K+2.580 
| Ce 2%— | | 
95.00% 
XA Kk 如 99.00% 
图 3-5 正 态 曲线 下 面积 示意 图 3-6 ” 正 态 曲 线 下 面积 的 分 布 规律 示 意图 


Sx 标准 正 态 分 


正 态 分 布 由 两 个 参数 4/ 和 确定 , 对 任意 一 个 服从 N(w, 中) 分 布 的 随机 变量 X, 经 式 (3-3) | 
变换 都 可 转换 为 =0、o=1 的 标准 正 态 分 布 (standard normal distribution ), 即 
-二 (3-3) 
o 


式 (3-3 ) 变 换 , 也 称 随 机 变量 的 标准 化 变换 ( standardized transformation )。z 的 概率 密度 函数 为 








下 ， 
9(z)= 2 一 co < 二 < 十 co (3-4) 
i € <z< ) | 
分 布 函数 为 
Di 
za- 3d (-c<z<teo) (3-5) 


实际 应 用 中 , 经 z 变换 可 把 求解 任意 一 个 正 态 分 布 曲线 下 面积 的 问题 , 转化 成 标准 正 态 分 
布 曲线 下 相应 的 面积 问题 (标准 正 态 分 布 曲线 下 面积 关系 如 图 3-7 所 示 )。 附 表 1 给 出 了 标准 正 
态 分 布 曲线 下 z 值 左 侧 尾部 面积 , 利用 标准 正 态 分 布 可 求 出 原始 变量 X 在 任意 区 间 的 概率 值 。 
由 于 标准 正 态 分 布 曲线 以 0 为 中 心 左右 两 侧 完全 对 称 , 故 表 中 只 列 出 了 = 值 的 负数 部 分 , 当 
z>0 时 可 以 使 用 式 (3-6) 计 算 








$(z)=1- $B(-z) (3-6) 





Cae 





图 3-7 标准 正 态 分 布 曲线 下 面积 示意 图 
z 在 区 间 (z,z) 上 的 概率 (曲线 下 的 面积 ) 计 算 公式 为 
Plza <z<z)= 8B(z,) -Bz,) (3-7) 
当 j 和 ao 未知 时 ,可 以 利用 样本 均 数 基 和 标准 差 $ 计 算 z, 即 


pn (3-8) 
S 








笔记 


笔记 
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例 3-1 车 XN(1, 吕 ), 试 计算 X 取 值 在 区 间 1+1.96c 上 的 概率 。 
先 做 标准 化 变换 , 求 X 所 对 应 的 z 值 , 根据 式 (3-3 ) 计 算 
Xi—-u4 (4-1.960)—y 








= = - =—1.96 
oO o 

5 和 一 人 CUT+1.96a) 一 人 -196 
o 0o 


通过 查 附 表 1, 由 式 (3-6) 和 式 (3-7) 可 得 
P(-1.96<z<1.96)= 6G(1.96)- B(-1.96)=(1-8(-1.96))- B(-1.96) 
=1-28(-1.96)=1-2x0.025=0.95 


即 苞 取 值 在 区 间 wk 土 1.96c 上 的 概率 为 95%。 同 理 , P(2.58<z<2.58)=0.99, 即 多 取 值 在 区 间 
At+2.58c 上 的 概率 为 99%。 对 于 正 态 分 布 而 言 , 1.96 和 2.58 这 两 个 数值 经 常会 被 用 到 。 

例 3-2 已 知 某 地 140 名 正常 成 年 男子 红细胞 计数 近似 服从 正 态 分 布 ， X=4.78 x 102/L， 
S=0.38 x 1025/L, 试 估计 : @ 该 地 正常 成 年 男子 红细胞 计数 在 4.0x 102L 以 下 者 占 该 地 正常 成 
年 男子 总 数 的 百分比 ; 红细胞 计数 在 4.0 x 102/L-5.5x 102/L 者 占 该 地 正常 成 年 男子 总 数 的 
百分比 s 

求 红细胞 计数 在 某 个 范围 内 的 人 数 占 总 人 数 的 比例 , 即 是 求 此 区 间 内 正 态 曲线 下 的 面积 
问题 。 

(1) 将 X=4.0 代 入 式 (3-8) 得 








0.38 

于 是 问题 转化 成 了 求 标准 正 态 分 布 z 值 小 于 -2.05 的 概率 , 查 附 表 1 得 @(-2.05 )=0.0202, 表明 
该 地 成 年 男子 红细胞 计数 低 于 4x 102/L 者 约 占 该 地 正常 成 年 男子 总 数 的 2.02%。 

〈2) 分 别 计 算 闷 =4.0 和 癌 =5.5 所 对 应 的 z 值 
4.00—4.78 XY-n 5.50 一 4.78 
2 i 
0.38 o 0.38 

=(1-@G(-1.89))- G(-2.05)=(1 一 0.0294) 一 0.0202 二 0.9504 


表明 红细胞 计数 在 4.0x 102L-5.5x 102L 者 约 占 该 地 正常 成 年 男子 总 数 的 95.04%。 








)=P(-2.05<z<1.89) 





P(4.00<X<5.50)=P( 
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-、| 括 学 参考 值 范围 的 概念 
所 谓 医学 参考 值 范围 (medical reference range), 是 指 “ 正 常 ” 人 的 解剖 、 生 理 、 生 化 指标 等 数 
据 大 多 数 个 体 值 的 波动 范围 。 由 于 存在 生物 个 体 变异 , 虽然 都 是 “正常 ” 人 , 但 指标 的 测量 值 也 
会 有 所 不 同 , 即使 是 同一 个 体 的 数据 , 也 会 随 环境 .时间 等 变化 而 改变 , 因此 不 能 以 某 一 个 测量 
数据 作为 标准 , 而 必须 确定 一 个 波动 范围 。 医 学 参考 值 范围 的 确切 含义 是 , 从 选择 的 参照 总 体 
中 获得 的 所 有 个 体 观察 值 ,用 统计 学 方法 建立 百 分 位 数 界限 , 由 此 得 到 个 体 观察 值 的 波动 区 间 。 
通常 情况 ， 人 用 | ot 95% 参考 值 范 围 。 



















确定 i 范围 主要 有 两 方面 的 意义 : 一 是 基于 临床 实践 , 从 个 体 角度 , 作为 临床 上 判 
定 正 党 与 者 标准， 即 用 于 划分 界限 或 分 类 , 如 成 年 人 的 白细胞 计数 一 般 以 (4.0~10.0)x 


10YL 作为 医学 参考 值 范围 ; 二 是 基于 预防 医学 实践 , 从 人 群 角 度 , 可 用 来 评价 儿童 的 发 育 水 平 ， 
如 制订 不 同年 龄 .不 同性 别 儿童 某 项 发 育 指 标的 等 级 标准 ， 
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二 、 制 订 医 学 参考 值 范围 的 注意 事项 


1. 确定 同 质 的 参照 总 体 “一般 选 择 “正常 "人 , 但 需要 注意 的 是 , 所 谓 正常 不 是 指 机 体 任何 
器 官 、 组 织 的 形态 和 机 能 都 正常 的 人 , 而 是 指 符合 特定 健康 水 平 的 人 , 绝对 健康 是 不 存在 的 , 在 
每 个 人 身上 都 可 能 存在 着 某 种 程度 的 病理 状态 , 在 使 用 或 制定 临床 参考 值 范围 时 , “正常 人 "的 
健康 水 平 应 有 明确 的 界定 , 主要 是 排除 了 对 研究 指标 有 影响 的 疾病 或 有 关 因 素 的 同 质 人 群 。 例 
如 , 制订 血清 谷 再 转氨酶 (SGPT) 参 考 值 范围 “正常 "人 的 条 件 是 : 无 于 、 肾 、 心 、 脑 、 肌 肉 等 疾 
患 ; @ 近 期 未 服用 对 肝脏 有 损伤 的 药物 (如 握 丙 嗪 , 异 烟 峙 等); @ 检 测 前 未 做 剧烈 运动 。 此 外 ， 
在 划分 同 质 对 象 时 , 要 注意 地 区 、 民 族 , 性 别 、 年 龄 时间、 妊娠 等 因素 对 指标 的 影响 ,例如 红 细 
胞 计数 及 血红 蛋白 含量 , 男女 各 异 ,高原 居民 与 平原 居民 不 同 。 

2. 选择 足够 例 数 的 参照 样本 ”参照 样本 含量 的 确定 没有 统一 的 规则 , 它 与 总 体 分 布 有 关 ， 
若 接近 正 态 分 布 , 变异 度 又 不 是 很 大 , 需要 的 样本 含量 就 可 以 少 一 些 ; 反之 , 若 明显 偏 态 或 数据 
比较 分 散 ,需要 的 样本 含量 就 相应 地 多 一 些 。 通 常情 况 下 , 确定 参考 值 范围 需要 大 样本 , 如 果 
例 数 过 少 ,确定 的 参考 值 范围 往往 不 够 准确 。 

3. 控制 检测 误差 ”为 保证 原始 数据 可 靠 , 检测 过 程 中 要 严格 控制 随机 误差 ,避免 系统 误差 
和 过 失误 差 。 一 些 受 主观 因素 影响 的 指标 ,对 测定 的 方法 .分 析 仪 器 的 灵敏 度 、 试 剂 的 纯度 、 操 
作 的 熟练 程度 等 要 尽 可 能 做 到 标准 化 , 对 测量 环境 和 条 件 有 统一 的 规定 和 说 明 , 且 要 尽量 与 应 
用 医学 参考 值 范围 时 的 实际 情况 一 致 。 如 临床 检验 中 应 对 收集 样本 的 环境 和 生理 条 件 (温度 、 
季节 、 体 育 活动 强度 、 饮食、 妊娠 等 ), 收集 、 转 运 和 储藏 样品 的 方法 及 时 间 有 明确 的 规定 , 可 通 
过 人 员 培 训 、 控 制 检测 条 件 .重复 测定 等 措施 , 严格 控制 检测 误差 。 

4. 选择 单 、 双 侧 界 值 ”应 依据 专业 知识 确定 是 采用 单 侧 还 是 双 侧 界 值 , 即 决定 取 单 侧 范围 
还 是 双 侧 范围 值 。 例 如 , 白细胞 计数 无 论 过 高 或 过 低 均 属 异常 , 其 参考 值 范围 需 分 别 确定 下 限 
和 上 限 , 即 采用 双 侧 界 值 ; 有 些 指标 仅 过 大 或 过 小 为 异常 , 如 肺活量 仅 过 低 异常 , 血 铅 仅 过 高 异 
常 ， 只 需 确定 下 限 或 上 限 , 即 采用 单 侧 界 值 。 

5. 选择 适当 的 百分数 范围 ”参考 值 范围 是 指 绝 大 多 数 “正常 " 人 (参照 总 体 ) 测 量 值 的 所 在 
范围 。 所 谓 的 “ 绝 大 多 数 " 究竟 是 多 少 , 应 结合 专业 知识 , 根据 研究 目的 、 研 究 指标 的 性 质 、 数 
据 分 布 特征 等 情况 综合 考虑 百分数 范围 的 选择 , 可 以 取 80% 、90% 、95% 或 99% 等 ,其 中 以 95% 
最 为 常用 。 实 际 应 用 中 最 好 结合 “正常 * 人 和 病人 的 数据 分 布 特点 (图 3-8 和 图 3-9), 权衡 假 阳 
性 率 和 假 阴性 率 , 选择 适当 的 百分数 范围 。 若 “正常 "人 与 病人 数据 分 布 重 冯 较 多 , 为 避免 较 大 
的 假 阳性 和 假 阴性 错误 率 ,有 时 还 需 确 定 可 疑 值 范围 。 可 疑 值 范 围 不 宜 过 大 , 只 要 包括 交叉 重 
番 的 主要 部 分 即 可 , 或 根据 研究 目的 以 减 小 误诊 率 ( 假 阳性 率 ) 或 漏诊 率 ( 假 阴 性 率 ) 来 选择 , 临 
床 诊断 试验 中 常用 ROC 曲线 进行 综合 判定 。 如 研究 的 主要 目的 是 减少 假 阳性 (用 于 确诊 病人 









































正常 人 


误诊 
假 阳性 病人 


上 限 值 
到 3-8 ”两 组 人 群 的 数据 分 布 无 重 伙 示意 图 图 3-9 ”两 组 人 群 的 数据 分 布 有 重合 示意 图 
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或 选 定 科研 病例 ), 参考 值 范围 的 百分数 范围 要 取 大 一 些 ( 如 95% 或 99%); 如 研究 的 主要 目的 
是 减少 假 阴性 (用 于 初 得 病人 ), 参考 值 范围 的 百分数 范围 可 小 一 些 ( 如 90% 或 80% ) 

6. 选择 计算 参考 值 范围 的 方法 ”根据 资料 的 分 布 类 型 , 样本 含量 的 多 少 和 研究 目的 等 , 选 
用 适当 的 方法 确定 参考 值 范围 。 近 似 服 从 正 态 分 布 或 转换 为 正 态 分 布 的 资料 , 可 选用 正 态 近 似 
法 ; 不 服从 正 态 分 布 的 资料 , 可 选用 百 分 位 数 法 或 曲线 拟 合法 等 进行 计算 。 


三 、 医 学 参考 值 范围 的 计算 方法 


计算 参考 值 范围 的 方法 有 多 种 , 其 中 最 基本 的 有 正 态 分 布 法 和 百 分 位 数 法 。 表 3-1 给 出 了 
两 种 方法 90% .95% 和 99% 百分数 范围 的 计算 公式 。 两 种 方法 比较 , 百 分 位 数 法 适合 于 任何 分 
布 类 型 的 资料 , 故 在 实际 中 最 为 常用 , 但 由 于 参考 值 范围 所 涉及 的 常常 是 波动 较 大 的 两 端 数据 ， 
使 用 百 分 位 数 法 必须 要 有 较 大 的 样本 含量 , 否则 结果 不 稳定 ; 正 态 分 布 法 要 求 资 料 必须 服从 或 
近似 服从 正 态 分 布 , 优点 是 结果 较 稳定 , 在 样本 含量 不 是 很 大 的 情况 下 仍然 能 够 进行 处 理 , 缺 
点 是 适用 范围 较 窄 , 不 适合 偏 态 分 布 资料 。 如 偏 态 分 布 资料 经 变量 变换 ( 取 对 数 、 倒 数 等 ) 能 够 
转换 为 正 态 分 布 或 近似 正 态 分 布 , 依然 可 用 正 态 分 布 法 计算 参考 值 范围 。 





表 3-1 医学 参考 值 范围 的 正 态 分 布 法 和 百 分 位 数 法 计算 公式 














正 态 分 布 法 百 分 位 数 法 
ee 单 侧 
(%) 双全 的 双 例 
下 限 上 限 下 限 上 限 
90 XE1.645 X-1.285 +1.285 Ps~Pss Po Po 
95 无 十 1.968 XY-1.645 +1.645 Pss~Pas Ps Pss 
9 X+2.585 天-2.335 +2.335 a P > 





1. 正 态 分 布 法 ”对 服从 正 态 分 布 的 指标 , 可 根据 正 态 曲线 下 面积 的 分 布 规律 进行 参考 什 
范围 的 计算 , 具体 步骤 为 : D 对 资料 进行 正 态 性 检验 ; @ 若 资料 服从 正 态 分 布 , 需 计算 均 数 X 与 
标准 差 5; @ 按 式 (3-9) 计 算 参 考 值 范围 。 

义 主 zpS( 双 侧 ), 证 +zS 或 时 -zsS( 单 侧 ) (3-9) 

例 3-3 已 知 某 地 140 名 正常 成 年 男子 红细胞 计数 近似 服从 正 态 分 布 ,七 = 4.78 x 10L， 
5=0.38x 102/L, 试 估计 该 地 正常 成 年 男子 红细胞 计数 的 95% 参考 值 范围。 

近似 正 态 分 布 资料 可 按 正 态 分 布 法 处 理 , 因 红细胞 计数 值 过 大 或 过 小 均 为 异常 , 故 应 估计 
双 侧 95% 参考 值 范围 : 






+z00smS=4.78 土 1.96 x 0.38=(4.04, 5.52) 

即 该 地 正常 成 年 男子 红细胞 计数 的 95% 参考 值 范围 为 404x 10”1~5.52 x 10 /L。 

例 3-4 某 年 基地 测 得 100 名 正常 成 年 人 的 血 铅 含量 (hgydl) 如 下 ， 试 确定 该 地 正常 成 年 人 
血 铝 含量 的 95% 参考 值 范围 。 
8 8 8 8 9 9 
1 0 而 而 区 敬 WW 从 了 加 季 入 六 3 坟 芒 怒 切切 
13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 
ls 了 18 i8 1B 2 2 10 2 2 2 222223 HH% 2 25 26 
26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51 


根据 经 验 已 知 正常 成 年 人 的 血 铅 含 量 近似 对 数 正 态 分 布 , 因 此 首先 对 原始 数据 作对 数 变 
换 , 经 正 态 性 检验 可 知 对 数值 服从 正 态 分 布 (P> 0.50), 故 编制 对 数值 频数 表 ( 表 3-2), 再 利用 正 
态 分 布 法 求 95% 参考 值 范围 
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表 3-2 某 年 某 地 100 名 正常 成 年 人 血 铝 含 量 ( hg/dl) 对 数值 频数 表 











对 数组 段 频数 累计 频数 
0.6~ 4 4 
0.7~ 2 6 
0.8~ 5 11 
0.9~ 9 20 
1.0~ 这 32 
1.1~ 15 47 
1.2~ 18 65 
1.3~ 14 79 
1.4~ 12 91 
1.35~ 过 96 
1.6~ 可 99 

1.7~1.8 1 100 
合计 100 三 








依据 表 3-2, 设 交 为 对 数组 段 的 组 中 值 ,mn= 100, 》 /=120, > /=149.73， 则 对 数值 的 均 
数 和 标准 差 为 : 


去 2. 他 
x-27 = ny 
n 100 


OY 一 1203 
so -On 33-1207100 0 2406cngjal) 
nl 100-1 


因为 血 铅 含量 仅 过 大 异常 , 故 参考 值 范围 应 为 单 侧 , 求 单 侧 95% 上 限 值 : 
lg '(X+1.64S)=1lg (1.2+1.64x0.2406) =39.3173 (hg/dl) 
即 该 地 正常 成 年 人 血 铝 含量 95% 参考 值 范围 为 小 于 39.3173phg/dl。 

2. 再 分 位 数 法 ” 当 分 析 指标 例 数 ” 较 大 时 分 布 趋 于 稳定 , 若 不 满足 正 态 分 布 可 采用 百 分 位 
数 法 计算 参考 值 范围 。 

例 3-5 依据 表 2-4 某 地 630 名 50~60 岁 正常 女性 血清 甘油 三 酯 含量 (mmoyL ) 的 资料 , 估计 
其 血清 廿 油 三 酯 含量 的 单 侧 95% 参考 值 范围 , 为 该 地 50~60 岁 女性 高 血脂 诊断 与 治疗 提供 参考 
依据 。 

本 资料 显现 出 血清 廿 油 三 酯 含量 数值 偏 小 的 人 数 较 多 , 呈正 偏 态 分 布 , 故 选 用 百 分 位 数 法 
计算 参考 值 范围 ,依据 专业 知识 ,为 该 地 50~60 岁 女性 高 血脂 诊断 与 治疗 提供 参考 依据 应 计算 
单 侧 95% 界 值 Pys。 

Pos=1.90+(630 x 95%—580)/28x0.30=2.098( mmol/L) 
即 该 地 50~60 岁 正常 女性 血清 甘油 三 酯 含量 的 单 侧 95% 参考 值 范围 为 小 于 2.098mmolL。 

许多 统计 方法 都 要 求 资料 服从 正 态 分 布 或 近似 正 态 分 布 ,在 使 用 这 些 方法 之 前 需 对 资料 进 
行 正 态 性 判定 , 尤其 是 在 样本 含量 较 小 时 , 对 各 组 数据 要 分 别 子 以 考察 。 如 有 充足 的 专业 知识 
和 经 验 得 知 某 些 医学 指标 ( 身高 ,体重 、 血 常规 检测 指标 等 ) 服 从 正 态 分 布 , 或 样本 含量 足够 大 时 ， 
可 不 必 再 作 正 态 性 判定 。 正 态 性 判定 的 方法 有 两 类 : 一 是 图 示 法 ,图 示 法 简单 易 行 但 比较 粗 炊 ， 
依据 对 频数 表 和 直方 图 的 目测 或 绘制 概率 - 概率 图 ( probability-probability plot, P-P plot ) 和 分 位 
数 -分 位 数 图 (quantile-quantile plot, Q-Q plot), 可 粗略 了 解 观察 资料 是 否 服从 正 态 分 布 ; 二 是 计算 
法 , 即 通 过 计算 反映 正 态 分 布 特征 的 指标 对 观察 资料 是 否 服从 正 态 分 布 做 出 推断 , 常 采用 矩 法 、 
WW 检验 和 D 检 验 等 正 态 性 检验 方法 ,对 此 可 利用 统计 软件 获得 计算 结果 。 
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练习 题 
一 、 单 项 选择 题 
1. 正 态 曲 线 下 , 视 轴 上 从 均 数 到 +oo 的 面积 为 (。 ) 
A. 50% B. 95% C. 97.5% DD. 99% 


E. 不 能 确定 (与 标准 差 的 大 小 有 关 ) 
2. 标准 正 态 分 布 的 形状 参数 和 位 置 参 数 分 别 为 ( ) 


A. 0,1 好. 区 ,在 CC, Ns D; 古 现 hb 2. Sq 
3. 正 态 分 布 的 均 数 、 中 位 数 和 几何 均 数 之 间 的 关系 为 ( ) 
A. 均 数 与 几何 均 数 相等 B. 均 数 与 中 位 数 相等 
C. 中 位 数 与 几何 均 数 相等 D. 均 数 、 中 位 数 、 几 何 均 数 均 不 相等 


E. 均 数 、 中 位 数 、 几 何 均 数 均 相等 
4. 正常 成 年 男子 的 红细胞 计数 近似 服从 正 态 分 布 ,已 知 忒 =4.78x102/L,S=0.38x 102/L， 
z=(4.00 一 4.78)/0.38=-2.05, 1 一 B(z)=1 一 B( 一 2.05 )=0.9798, 则 理论 上 红细胞 计数 为 ( ) 
. 高 于 4.78x102/L 的 成 年 男子 占 97.98% 
. 低 于 4.78x10'3L 的 成 年 男子 占 97.98% 
. 高 于 4.00x10'3L 的 成 年 男子 占 97.98% 
. 低 于 4.00x103/L 的 成 年 男子 占 97.98% 
. 在 4.00x103L 至 4.78x109/L 的 成 年 男子 占 97.98% 
5. 某 项 指标 95% 医学 参考 值 范围 表示 的 是 (。 ) 
A. 在 此 范围 “异常 "的 概率 大 于 或 等 于 95% 
B. 在 此 范围 “正常 "的 概率 大 于 或 等 于 95% 
C. 在 "异常 "总 体 中 有 959% 的 人 在 此 范围 之 外 
D. 在 “正常 "总 体 中 有 95% 的 人 在 此 范围 
E. 在 人 群 中 检测 指标 有 5% 的 可 能 超出 此 范围 
6. 确定 某 项 指标 的 医学 参考 值 范围 时 ,“ 正 常人” 指 的 是 ( ) 
A. 从 未 患 过 疾病 的 人 B. 患 过 疾病 但 不 影响 研究 指标 的 人 
C. 排除 了 患 过 某 种 疾病 的 人 D. 排除 了 影响 研究 指标 的 疾病 或 因素 的 人 
E. 健康 状况 良好 的 人 
7. 某 人 群 某 项 生化 指标 的 医学 参考 值 范围 , 该 指标 指 的 是 ( 。 ) 
A. 在 所 有 人 中 的 波动 范围 B. 在 所 有 正常 人 中 的 波动 范围 
C. 在 绝 大 部 分 正常 人 中 的 波动 范围 D. 在 少 部 分 正常 人 中 的 波动 范围 
E. 在 一 个 人 不 同时 间 的 波动 范围 
8. 要 评价 菜 地 区 一 名 5 岁 男孩 的 身高 是 否 偏 高 ,其 统计 学 方法 是 (。 ) 


> 


包间 邓 





A. 用 均 数 来 评价 B. 用 中 位 数 来 评价 
C. 用 几何 均 数 来 评价 DD. 用 变异 系数 来 评价 


E. 用 参考 值 范围 来 评价 
9. 应 用 百 分 位 数 法 计算 参考 值 范围 的 条 件 是 ( 。 ) 

A. 数据 服从 正 态 分 布 B. 数据 服从 偏 态 分 布 
C. 有 大 样本 数据 D. 数据 服从 对 称 分 布 
E. 数据 变异 不 能 太 大 
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10. 某 市 1974 年 238 名 居民 的 发 尔 含 量 (Hhmolkg) 如 下 , 则 该 地 居民 发 尔 值 的 95% 医学 参 
考 值 范围 是 ( ) 





发 来 值 (hmol/kg) 15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 
人 数 20 66 60 48 18 16 6 1 0 | 
办 尼 ne B. >P; 
C. (Ps, Pns) D. X+1.965 
E. <X+1.645 


二 、 计 算 分 析 题 

1. 已 知 健康 男 童 的 体重 近似 服从 正 态 分 布 , 某 年 某 地 150 名 12 岁 健康 男 童 体重 的 均 
数 卫 =36.3kg, 标准 差 8S=6.19kg, 试 估计 :该 地 12 岁 健康 男 童 体重 在 50kg 以 上 者 占 该 地 
12 岁 健康 男 童 总 数 的 百分比 ; 加 该 地 12 岁 健康 男 童 体重 在 30~40kg 者 占 该 地 12 岁 健康 男 
童 总 数 的 百分比 ; @ 该 地 80% 的 12 岁 健康 男 童 体重 集中 在 哪个 范围 ; 图 估 计 该 地 12 岁 健 
康 男 童 体重 的 95% 参考 值 范围 。 

2. 某 地 200 例 正 常 成 年 人 血 铝 含 量 (hmol/L ) 的 频数 分 布 如 下 , 试 估计 该 地 正常 成 年 
人 血 铅 含量 的 95% 参考 值 范围 





i < 
血 铅 含 量 (pmolL) 0~ 0.24~ 0.48~ 0.72~ 0.96~ 1.20~ 1.44~ 1.68~ 1.92~ 2.16~ 2.40~ 2.64~ 
频数 7 和 等 用 入 和 和 4 4 1 名 1 

















笔记 
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在 医学 研究 中 , 除了 前 述 的 定量 数据 , 还 有 如 阴性 和 阳性 、 有 效 和 无 效 .治愈 和 未 治愈 、 死 
亡 和 生存 以 及 各 种 疾病 分 类 等 类 型 的 定性 数据 。 对 这 些 数据 的 整理 往往 是 先 将 研究 对 象 按 其 
性 质 或 特征 分 类 , 再 分 别 计数 每 一 类 的 例 数 。 描 述 定性 数据 的 数据 特征 , 通常 需要 计算 相对 数 。 
根据 不 同 的 研究 目的 , 常用 率 、 构 成 比 、 相 对 比 等 指标 来 进行 统计 描述 。 


第 一 节 ”常用 相对 数 


相对 数 (relative number) 是 两 个 有 关 的 绝对 数 之 比 , 也 可 以 是 两 个 有 关联 统计 指标 之 比 。 相 
对 数 的 性 质 取决 于 其 分 子 和 分 母 的 意义 , 不 同类 型 的 相对 数 具 有 不 同 的 性 质 。 计 算 相 对 数 的 
意义 主要 是 把 基数 化 作 相等 , 便于 相互 比较 。 例 如 , 某 病 用 A 法 治疗 100 人 , 其 中 75 人 有 效 ， 
B 法 治疗 150 人 , 100 人 有 效 , 若 仅 比较 两 组 有 效 的 绝对 人 数 是 不 恰当 的 ,而 通过 分 别 计算 有 效 
率 75/100x100%=75% 与 100/150x100%=66.7% 来 比较 两 法 的 疗效 才 有 实际 意义 。 常 用 的 相 
对 数 指标 有 率 、 构 成 比 和 相对 比 。 


二 


率 (rate ) 表 示 在 一 定 空间 或 时 间 范 围 内 某 现象 的 发 生 数 与 可 能 发 生 的 总 数 之 比 , 说 明 某 现 
象 出 现 的 强度 或 频率 , 通常 以 百分率 (%)、 千 分 率 (%。). 万 分 率 (1/ 万 )、 或 十 万 分 率 (1/10 万 ) 等 
来 表示 。 计 算 公式 为 

率 一共 事物 或 现象 发 生 的 实际 数 十 业 Cal) 
某 事物 或 现象 发 生 的 所 有 可 能 数 
公式 中 的 “比例 基数 " 通常 依据 习惯 而 定 , 如 治愈 率 、 感 染 率 用 百分率 , 出 生 率 、 死 亡 率 用 千 分 
率 , 某 些 疾 病 的 死亡 率 用 十 万 分 率 。 总 体 率 用 来 表示 , 样本 率 用 来 表示 。 需 要 注意 的 是 ， 
率 在 更 多 情况 下 是 一 个 具有 时 间 概念 的 指标 , 即 用 于 说 明 在 一 段 时 间 内 某 现象 发 生 的 强度 或 频 
率 , 如 出 生 率 、 死 亡 率 、 发 病 率 等 , 这 些 指标 通常 是 指 在 1 年 时 间 内 发 生 的 频率 。 

例 4-1 某 单位 在 2009 年 有 3128 名 职工 , 该 单位 每 年 对 职工 进行 体检 , 在 这 一 年 新 发 生 高 

血压 病人 12 例 , 则 








12 
3128 


-、 构 成 上 比 


构成 比 ( proportion ) 表 示 某 事物 内 部 各 组 成 部 分 在 整体 中 所 占 的 比重 , 常 以 百分数 表示 , 计 
算 公式 为 


高 血压 发 病 率 = 





x 1000%o = 3.84%o0 


构成 比 = 该 事物 内 部 茶 一 组 成 部 分 的 观察 单位 数 ( 例 数 ) 区 4 
某 事物 内 部 的 所 有 观察 单位 之 和 ( 例 数 之 和 ) 
例 4-2 某 医院 某 月 住院 病人 数 及 死 疡 人 数 如 表 4-1 所 示 , 其 中 第 (4) 列 为 构成 比 , 是 由 第 
(3) 列 数据 计算 而 得 。 第 (5 ) 列 为 率 , 是 由 第 (2 ) 与 第 (3 ) 列 数据 计算 而 得 。 
由 表 4-1 中 的 第 (4) 与 第 (5 ) 列 可 看 出 ,构成 比 和 率 虽然 同 是 相对 数 ,但 却 是 两 种 不 同 的 概 
念 ,应 用 的 场合 不 同 , 应 特别 注意 。 构 成 比 之 和 应 为 100%, 某 一 构成 部 分 的 增 减 会 影响 其 他 构 


28 
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表 4-1 某 医疗 机 构 某 月 住院 病人 数 及 死亡 人 数 统计 | 











疾病 类 型 病人 数 病死 人 数 死亡 构成 (% ) 病死 率 (%o) 
(1) (2) (3) (4) (5) | 
呼吸 系统 疾病 620 25 23.81 40.32 
循环 系统 疾病 1030 35 33.33 33.98 
消化 系统 疾病 540 20 19.05 37.04 
恶性 肿瘤 300 25 23.81 83.33 
合计 2490 105 100.00 42.17 






成 部 分 相应 的 减少 或 增加 ; 而 某 一 部 分 率 的 变化 并 不 影响 其 他 部 分 率 的 变化 , 且 其 平均 率 不 能 

简单 地 将 各 率 相 加 后 平均 求 得 。 这 里 需要 注意 的 是 , 死因 构成 比 只 能 说 明 某 病死 亡 人 数 在 总 死 
亡 人 数 中 所 占 比重 , 如 果 需 要 描述 其 致死 的 严重 程度 , 则 要 计算 病死 率 。 

三 .相对 比 | 

相对 比 (relative ratio ) 是 A、B 两 个 有 关联 指标 值 之 比 , 用 以 描述 两 者 的 对 比 水 平 ,说 明 A 是 | 


B 的 若干 倍 或 百 分 之 几 , 通常 用 倍数 或 百分数 表示 。 这 两 个 指标 可 以 性 质 相同 , 如 不 同时 期 的 
患 病人 数 之 比 , 也 可 以 性 质 不 同 , 如 体重 与 身高 的 平方 之 比 ( 体 重 指数 , BMI)。 其 计算 公式 为 


相对 比 一 人 (x 100%) (4-3) 


1. 两 类 别 例 数 之 比 ” 如 我 国 2010 年 人 口 普查 的 男性 人 口 数 为 686852572 人 ,女性 人 口 数 
为 652872280 人 , 则 | 
686 852 572 

男女 性 别 比 orn eo onn os 
即 男 性 人 口 数 是 女性 的 1.052 倍 。 | 
2. 相对 危险 度 (relative risk, 简 记 为 RR) 是 流行 病 学 前 瞻 性 研究 中 常用 的 指标 , 表示 在 两 | 

种 不 同 条 件 下 某 疾病 发 生 的 概率 之 比 , 反映 暴露 组 发 病 或 死亡 的 危险 是 非 暴露 组 的 多 少 倍 , 说 
明 疾 病 与 暴露 之 间 的 关联 强度 。 其 计算 公式 为 | 














RR- 卫 (4-4) | 
=- 2 | 


其 中 忆 为 暴露 组 的 发 病 率 或 患 病 率 , Po 为 非 暴露 组 的 发 病 率 或 患 病 率 。 
例 4-3 某 地 区 非 吸烟 女性 饮酒 者 和 不 饮酒 者 的 肺癌 发 病 资料 如 表 4-2 所 示 , 试 计算 其 相 
对 危险 度 。 


表 4-2 某 地 区 非 吸 烟 女 性 饮酒 者 和 不 饮酒 者 的 肺癌 发 病 资 料 





饮酒 与 否 发 病 数 观察 人 年 数 发 病 率 ( 1/10 万 人 年 ) 
是 6 12 965.2 46.3 
从 265 660291.4 40.1 





相对 危险 度 为 






赔 明 该 地 区 非 吸烟 女性 饮酒 者 的 肺癌 发 病 率 是 非 吸烟 女性 不 饮酒 者 的 1.15 倍 
3. 比 数 比 (odds ratio, 简 记 为 OR) 常用 于 流行 病 学 中 病例 - 对 照 研 究 资料 , 表示 病例 组 和 
对 赂 组 中 的 暴露 比例 与 儒 暴 露 比例 的 比值 之 比 , 是 反映 疾病 与 暴露 之 问 关联 强度 的 指标 。 其 计 
算 公 式 为 二 记 


Wa 
并 
< 
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P/(-P) 
Pp/d-P) 
其 中 Pi 为 病例 组 的 暴露 比例 , Po 为 对 照 组 的 暴露 比例 。 另 外 , Pi 也 可 定义 为 在 暴露 状态 下 的 发 
病 率 , Po 为 在 非 暴 露 状态 下 的 发 病 率 , 两 种 定义 的 计算 结果 完全 相同 。 
例 4-4 母亲 围 孕 期 是 否 有 发 热 或 感冒 病史 与 观 儿 神 经 血管 畸形 关系 的 病例 对 照 研究 的 资 
料 如 表 4-3 所 示 , 试 计算 母亲 围 孕 期 是 否 有 发 热 或 感冒 病史 引起 婴儿 神经 血管 畸形 的 比 数 比 。 





(4-5) 


| 表 4-3 ”母亲 围 孕 期 是 否 有 发 热 或 感冒 病史 与 婴儿 神经 血管 畸形 的 关系 











发 热 或 感冒 病史 神经 血管 畸形 组 对 照 组 合计 
有 40(a) 20(4b) 60 

无 112(c) 203(d) 315 

合计 152(a+c) 223(b+d) 375 





病例 组 中 的 暴露 比例 与 非 暴露 比例 分 别 为 














Bs a ,1-p= C 
a+te at+c 
对 照 组 的 暴露 比例 与 非 暴露 比例 分 别 为 
R=-B a 
b+d b+d 
由 公式 (4-5 ) 可 以 得 出 
_ B/d=B) [a/(@a+]/[e/(a+o] _ad (4.6) 
R/IM-PB) EM+cD [ao+d] be 
本 例 
_40x203 _ 
20xll2 
即 母亲 围 孕 期 是 否 有 发 热 或 感冒 病史 引起 婴儿 神经 血管 畸形 的 优势 比 为 3.63 倍 。 
四 . 标准 化 率 


| “在 比较 两 个 不 同人 群 的 患 病 率 、 发 病 率 、 死 亡 率 等 资料 时 , 为 消除 其 内 部 构成 (如 年 龄 .性 
别 ,工龄 ,病程 长 短 、 病 情 轻重 等 ) 对 率 的 影响 , 可 以 使 用 标准 化 率 (standardized rate)。 
例 4-5 甲乙 两 医院 治愈 率 比较 的 资料 如 表 4-4 所 示 。 





表 4-4 甲乙 两 医院 治愈 率 的 比较 

















科室 甲 医 院 乙 医院 
入 院 人 数 治愈 人 数 。” ”治愈 率 (%) 入院 人 数 治愈 人 数 。” ”治愈 率 (%) 
内 科 1500 975 65.0 500 315 63.0 
外 科 500 470 94.0 1500 1365 91.0 
传染 病 科 500 475 95.0 500 460 92.0 
合计 2500 1920 76.8 2500 2140 85.6 





| 从 表 4.4 可 以 看 出 ,对 于 任何 -科室 , 甲 医院 的 治 意 率 均 高 于 乙 医 院 , 但 甲 医院 的 总 治 全 

| Pe et ee thm te ep 

率 偏 低 。 若 将 两 医院 治愈 率直 接 进行 比较 , 结果 显然 是 不 合理 的 。 为 了 正确 比较 两 医院 治 人 

的 大 小 , 统计 学 上 常用 标准 化 的 方法 来 消除 内 部 构成 的 影响 , 即 先 将 两 医院 科室 的 构成 按照 统 
一 的 标准 进行 校正 ,计算 出 校正 的 标准 化 治愈 率 后 再 进行 比较 。 
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常用 的 标准 化 法 包括 直接 标准 化 法 和 间接 标准 化 法 , 根据 已 有 资料 的 实际 情况 ,可 以 采用 





其 中 一 种 方法 。 本 节 仅 介绍 常用 的 直接 法 。 
1. 标准 化 直接 法 的 计算 公式 为 
_NB+NB+…+NR NP (4.7) 
N N 
式 中 忆 为 标准 化 率 , N,N,,…Ni 为 某 一 影响 因素 (如 病 型 、 年 龄 等 ) 标 准 构成 的 每 层 例 数 , P， 
P，,…, Pi 为 原始 数据 中 各 层 的 率 , N 为 标准 构成 的 总 例 数 。 上 式 也 可 写成 
P=CR+CR+…+CR=> CR (4-8) 
式 中 , C=N/N 为 标准 构成 比 。 
2. 标准 构成 的 选取 ”标准 化 法 计算 的 关键 是 选择 统一 的 标准 构成 , 选取 标准 构成 的 方法 
通常 有 下 面 三 种 : 
(1) 选取 有 代表 性 的 、 较 稳定 的 、 数 量 较 大 的 人 群 构成 为 标准 构成 , 如 全 国 范围 或 全 省 范围 
的 数据 作为 标准 构成 ; 
(2) 选择 用 于 比较 的 各 组 例 数 合计 作为 标准 构成 ; 
(3) 从 比较 的 各 组 中 任 选 其 一 作为 标准 构成 。 
例 4-6 试 对 表 4-4 资 料 计 算 甲乙 两 个 医院 的 标准 化 率 。 
将 比较 各 组 的 各 层 例 数 的 合计 作为 标准 构成 , 即将 两 医院 各 科室 的 人 数 之 和 作为 标准 构 
成 , 根据 两 医院 各 层 的 治愈 率 , 计算 两 医院 各 层 的 预期 治愈 数 , 最 后 得 到 两 组 标准 化 后 的 预期 
治愈 数 , 其 计算 结果 如 表 4-5 所 示 。 


表 4-5 ”消除 构成 影响 后 两 医院 治愈 率 的 比较 





P' 




















Re 标准 构成 甲 医院 区 区 
人 数 原 治愈 率 (%) 预期 治愈 数 。” 原 治愈 率 (%) 预期 治愈 数 
内 科 2000 65.0 1300 63.0 1260 
外 科 2000 94.0 1880 91.0 1820 
传染 病 科 1000 95.0 950 92.0 920 
合计 5000 4130 4000 





按 公式 (4-7) 计 算得 到 甲 医院 标准 化 后 的 总 治愈 率 为 
’ -4130、 ox 一 9 
PE 100%=82.6% 
乙 医 院 标准 化 后 的 总 治愈 率 为 
1 
Pe= 5000* 100%=80.0% 
由 上 可 见 , 甲 医院 标准 化 后 的 总 治愈 率 高 于 乙 医 院 标准 化 后 的 总 治愈 率 。 需 要 注意 : 标准 
化 率 只 代表 相互 比较 的 各 组 间 的 相对 水 平 , 而 不 能 反映 实际 情况 ; 另外 , 选用 的 标准 不 同 , 得 到 
的 标准 化 率 可 能 不 同 。 





第 二 节 ”医学 中 常用 的 相对 数 指标 





1. 死亡 率 (mortality rate) 又 称 粗 死 亡 率 (crude death rate )， 表示 某 年 某 地 每 千 人 口中 的 死 
亡 人 数 , 反映 当地 居民 总 的 死亡 水 平 , 计算 公式 为 
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某 年 某 地 死亡 人 口 总 数 
于 广 率 一 后 年 该 地 年 平均 人 口 数 ”! Re 

计算 死亡 率 时 需 注意 分 母 必 须 是 与 分 子 相对 应 的 人 口 , 同年 平均 人 口 等 于 年 初 人 口 和 年 末 
人 口 的 平均 值 , 在 实际 工作 中 , 常 以 计算 平均 人 口 数 , 表示 某 一 年 的 人 口 数量 水 平 。 一 般 情况 
下 ,老人 和 婴儿 的 死亡 率 较 高 , 男性 的 死亡 率 高 于 女性 。 因 此 , 对 不 同 地 区 的 死亡 率 进 行 比较 
时 ,应 注意 不 同 地 区 人 口 年 龄 或 性 别 构成 的 影响 , 若 年 龄 或 性 别 构成 存在 差异 , 需 先 将 死亡 率 
标 化 后 再 进行 比较 。 

2. 年 龄 别 死亡 率 (age-specific death rate) 表示 某 年 某 地 每 千 人 口中 的 死亡 数 , 它 消除 了 人 
口 年 龄 构成 不 同 对 死亡 水 平 的 影响 , 计算 公式 为 
某 年 某 地 某 年 龄 组 死亡 人 数 
同年 该 地 同年 龄 别 平 均 人 口 数 

3. 死因 别 死 亡 率 (cause specific death rate ) 表示 某 年 某 地 每 10 万 人 中 因 某 种 疾病 死亡 的 
人 数 , 它 反映 各 类 病 伤 死亡 对 居民 生命 的 危害 程度 , 是 死因 分 析 的 重要 指标 , 计算 公式 为 


某 病 死亡 率 = 和 x 100 000/10 万 (4-11) 


4. 死因 构成 (proportion of dying of a specific cause) 也 称 相对 死亡 比 ， 指 全 部 死亡 人 数 中 ， 
死 于 某 死因 者 占 总 死亡 数 的 百分比 , 反映 各 种 死因 的 相对 重要 性 , 计算 公式 为 
因 某 种 死因 死亡 的 人 数 


gb = x 100% (4-12 
某 种 死因 的 构成 比 总 元 六 人 并 ) 





年 龄 别 死亡 率 = x 1000%o (4-10) 











二 、 疾 病 统计 指标 
1. 发 病 率 (incidence rate) 表示 在 一 定期 间 内 ， 一 定 人 群 中 某 病 新 发 生 的 病例 出 现 的 频率 ， 
是 反映 疾病 对 人 群 健康 影响 和 描述 疾病 分 布 状态 的 一 项 测量 指标 。 其 计算 公式 为 


8 某 时 期 某 病 新 病例 数 
某 病 发 病 率 ~ 同期 间 内 平均 人 口 数 “ 比例 基数 (4-13) 
需要 注意 的 是 ,分 母 中 所 规定 的 平均 人 口 是 指 可 能 会 发 生 该 病 的 人 群 , 对 于 那些 正在 患 病 或 不 
可 能 患 该 病 的 人 (如 已 接种 疫苗 有 效 者 ) 不 应 计算 入 分 母 内 。 
2. 患 病 率 (prevalence rate) 也 称 现 患 率 ， 表示 某 一 时 点 某 人 群 中 患 某 病 的 频率 ,通常 用 来 
表示 病程 较 长 的 慢性 病 的 发 生 或 流行 情况 ,计算 公式 为 
， _ 某 地 某 时 点 某 病 患 病例 数 ,4 
某 病 患 病 率 = 该 地 同期 内 平均 信 口 数 比例 基数 (4-14) 
以 上 比例 基数 可 为 100%、1000%。o、10000/ 万 、100000/10 万 ,应 根据 流行 病 学 的 专业 要 求 决定 。 
实际 中 患 病 率 的 分 母 通常 为 调查 的 总 人 数 , 分子 为 患 病 的 人 数 。 
3. 病死 率 (case fatality rate) 表示 某 期 间 内 , 某 病 患者 中 因 该 病死 亡 的 频率 , 表明 该 疾病 
的 严重 程度 和 医疗 水 平等 , 多 用 于 急性 传染 病 , 计算 公式 为 


某 期 间 因 某 病 死亡 人 数 








某 病 病死 率 = 一 一 一 一 一 一 一 一 一 一 x 100% 4-15 
这 同期 该 病 的 患 病 人 数 
4. 治愈 率 (cure rate) 表示 接受 治疗 的 病人 中 治愈 的 频率 , 计算 公式 为 
YA B= 
治 钝 率 = 半 仿 病人 人数、 100% (4-16) 


接受 治疗 病人 数 


第 三 节 ”相对 数 指标 使 用 的 注意 问题 


1. 不 要 把 构成 比 与 率 相 混淆 ”构成 比 只 能 说 明 某 事物 内 部 各 组 成 部 分 的 比重 和 分 布 , 不 
能 说 明 该 事物 某 一 部 分 发 生 的 强度 与 频率 。 如 表 4-1, 从 第 (4) 列 的 构成 可 看 出 循环 系统 疾病 的 
病死 人 数 占 全 院 病死 人 数 的 比例 最 大 , 但 从 第 (5 ) 列 各 类 疾病 的 病死 率 来 看 , 恶性 肿瘤 的 病死 
率 最 高 , 它 反映 了 各 类 疾病 死亡 危险 性 的 大 小 。 

2. 使 用 相对 数 时 分 母 不 宜 过 小 ”分 母 过 小 时 相对 数 不 稳 定 。 如 使 用 某 药物 治疗 5 例 病人 
中 4 例 有 效 , 计算 有 效率 为 80% , 若 3 例 有 效 , 则 有 效率 为 60%, 虽然 只 有 1 例 的 变化 , 但 是 波 
动 幅度 较 大 。 因 此 , 在 观察 例 数 较 小 时 , 最 好 直接 用 绝对 数 表示 , 以 免 引 起 误解 。 

3. 注意 资料 的 可 比 性 ”在 比较 相对 数 时 , 用 以 比较 的 资料 应 是 同 质 的 , 即 除了 要 比较 的 处 
理 因素 外 , 其 他 条 件 应 尽量 相同 或 相近 。 对 不 同时 期 、 地 区 、 条 件 下 的 资料 进行 比较 时 应 注意 
观察 对 象 、 研 究 方法 、 观 察 时 间 等 是 否 齐 同 , 尤其 对 于 不 同时 期 的 资料 应 考虑 客观 条 件 是 否 相 
同 。 同 时 还 应 观察 待 比较 组 间 的 资料 内 部 构成 是 否 相 同 , 如 两 组 间 年 龄 等 构成 不 同 , 可 分 别 比 
较 各 年 龄 别 的 率 或 者 对 总 率 进行 标准 化 后 再 比较 。 

4. 样本 率 或 构成 比 存在 抽样 误差 ”对 样本 率 或 构成 比 进行 比较 时 , 由 于 存在 抽样 误差 , 不 
能 单 赁 数字 表面 相差 的 大 小 而 下 结论 , 应 对 各 组 的 样本 率 或 构成 比 的 差别 作假 设 检验 (参见 第 
九 童 )。 





Vi 
5 

六 
| 

ES 


种 新 的 治疗 方法 能 够 使 不 能 治 念 的 疾病 得 到 缓解 并 延长 生命 , 则 应 发 生 的 情况 


售 










血清 学 检查 的 阳 转 率 , 分 母 为 ( ) 
B. 平均 人 口 数 
度 苗 接 种 人 数 D. 乙肝 患者 人 数 






的 目的 是 ( ) 
5 计 的 偏 倚 





适当 的 比较 方法 是 


多 ,而 己 乡 男 届 
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最 有 可 能 是 ( ) 
. 甲 县 的 诊断 水 平 高 
. 甲 县 的 肿瘤 防治 工作 比 乙 县 好 
. 甲 县 的 人 口 健康 水 平 高 
. 甲 县 的 老年 人 口 在 总 人 口中 所 占 比 例 更 小 
甲 县 的 老年 人 口 在 总 人 口中 所 占 比 例 更 大 
6. 相对 危险 度 RR 的 计算 方法 是 (。 ) 
A. 两 个 标准 化 率 之 比 
C. 两 种 不 同 疾病 患 病 率 之 比 
E. 两 种 不 同 条 件 下 某 疾 病 发 生 的 概率 之 比 
7. 比 数 比 OR 值 表示 的 是 (  ) 
A. 两 个 标准 化 率 的 差别 大 小 
C. 两 种 不 同 疾病 患 病 率 差别 程度 
EE. 两 种 不 同 条 件 下 菜 疾 病 发 生 的 危险 性 程度 
8. 计算 患 病 率 时 的 平均 人 口 数 的 计算 方法 是 ( 
A. 年 初 人 口 数 和 年 未 人 口 数 的 平均 值 
C. 全 年 年 未 的 人 口 数 
E. 生活 至 少 在 半年 以 上 的 总 人 口 数 
9. 死因 构成 比 反 映 的 是 ( ) 
A. 各 种 疾病 发 生 的 严重 程度 
C. 疾病 在 人 群 的 分 布 情况 
E. 各 种 疾病 的 死亡 风险 大 小 
10. 患 病 府 与 发 病 率 的 区 别 是 (。” ) 
A. 冲 病 六 高 于 发 病 率 
C. 计算 患 病 率 不 包括 新 发 病例 
E. 患 病 率 与 病程 上 有 关 
二 、 计 算 与 分 析 


对 轧 


HOO 


BB 
D. 


) 


B. 
. 生活 满 一 年 的 总 人 口 数 


. 两 种 不 同 疾病 的 发 病人 数 之 比 
. 两 种 不 同 疾病 发 病 率 之 比 


两 种 不 同 疾病 的 发 病 滨 差别 程度 
两 种 不 同 疾病 的 严重 程度 


全 年 年 初 的 人 口 数 


. 疾病 发 生 的 主要 原因 
. 各 种 死因 的 相对 重要 性 


. 患 病 率 低 于 发 病 率 
.发病 率 更 容易 获得 


1. 为 了 解 菜单 位 职工 冠 心病 的 总 病情 况 ， 对 全 体 职工 进行 体检 后 发 现 ,在 该 单位 
1290 名 职工 中 , 患 冠 心病 的 有 305 人 ,其 中 女性 110 人, 占 36%, 男性 195 人 , 占 64%, 因此 


认为 男性 易 总 冠 心病 ,这 种 结论 是 否 正确 ? 为 什么 ? 


2. 在 “ 镜 剂 短程 疗法 治疗 血吸虫 病 病 例 的 临床 分 析 " 一文 中, 根据 下 表 资 料 认为 “其 
中 10~ 岁 组 死亡 率 最 高 ,其 次 为 20~ 岁 组 "， 问 这 种 说 法 是 否 正确 ? 


锁 剂 治疗 血吸虫 不 同性 别 死亡 者 年 龄 分 布 























年 龄 组 ( 岁 ) E3] 女 合计 
0- 3 3 6 
10~ 11 18 
20~ 4 6 10 
30~ 5 | 8 
40~ 1 2 3 
50-- 5 1 6 
合计 29 22 51 
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3. 茶 市 对 其 茶 区 的 各 型 病毒 性 肝炎 的 疫情 资料 进行 分 析 结 果 如 下 表 所 示 , 发现 1998 
年 与 2007 年 相 比 , 甲肝、 乙肝 和 未 分 型 病毒 性 肝炎 的 构成 比 均 有 所 下 降 , 而 丙肝 和 成 肝 的 
构成 比 则 呈 上 升 趋 势 , 尤其 以 丙肝 的 构成 比 上 升 最 明显 。 若 据 此 得 出 “乙肝 发 病 率 下 降 ， 
丙肝 发 病 率 上 升 " 的 结论 , 是 否 正 确 ? 请 陈述 理由 。 


某 市 某 区 1998 年 和 2007 年 病毒 性 肝炎 发 病情 况 














疾病 1998 年 2007 年 
发 病 数 构成 比 (% ) 发 病 数 构成 比 (% ) 

甲肝 21 5.53 6 4.92 
乙肝 182 47.89 42 34.43 
丙肝 1 0.26 过 9.02 
戊 肝 13 3.42 41 33.61 
未 分 型 163 42.89 总 18.03 
合计 380 100.00 122 100.00 





4. 现 有 两 个 煤矿 的 工人 上 尘肺 患 病 率 (%) 如 下 表 所 示 , 试 比较 两 个 煤矿 的 工人 土 肺 总 


两 个 煤矿 的 工人 尘肺 患 病 率 情况 (% ) 














工龄 甲 矿 乙 矿 

(年 ) 检查 人 数 尘肺 人 数 。 ” 患 病 率 (%) ”检查 人 数 。”” 人 尘肺 人 数 。 襄 病 率 {% ) 
0~ 14026 120 0.86 992 到 0.20 
6~ 4285 168 3.92 1905 8 0.42 

10~30 2542 316 12.43 1014 117 11.54 

合计 20 853 604 2.90 3911 127 3.25 





5. 现 有 甲乙 两 地 某 月 居民 的 粗 死亡 率 资 料 如 下 表 所 示 , 试 比较 两 地 死亡 这 水 平 高 低 

















甲乙 两 地 某 月 粗 死亡 率 比较 四 
年 龄 甲 地 区 
( 岁 ) 死亡 数 人 口 数 死亡 率 (%o) 
0~ 20 1000 20 180 6000 30 
25~ 120 3000 40 150 3000 50 
65~ 360 6000 60 70 1000 70 
合计 500 10000 50 400 10000 40 
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统计 表 和 统计 图 是 统计 描述 的 重要 工具 。 在 统计 工作 的 整个 过 程 中 , 从 实验 设计 或 调查 设 
| 计 开 始 , 直到 最 后 分 析 总 结 , 为 突出 数据 的 说 服 力 , 都 要 用 统计 表 和 统计 图 进行 描述 , 尤其 在 科 
| 研 论文 中 , 表达 统计 结果 及 进行 对 比分 析 时 , 应 用 更 为 广泛 。 目 前 统计 表 和 统计 图 的 制作 主要 

使 用 统计 软件 , 因此 本 章 对 有 关 手 工 制作 的 方法 不 作 介绍 。 


第 一 节 统 计 表 


统计 表 (statistical table ) 是 把 统计 资料 和 结果 用 表格 的 形式 进行 表达 , 其 目的 是 简洁 、 清 晰 、 
直观 ,方便 对 比 和 阅读 。 统 计 表 有 基本 的 制作 要 求 , 并 不 是 把 数据 放 到 表格 里 就 形成 统计 表 。 
同时 也 要 注意 , 不 是 所 有 的 数据 都 需要 制作 统计 表 , 应 该 有 选择 性 地 对 重点 要 表达 的 数据 制作 
统计 表 。 





(一 ) 统计 表 的 编制 原则 

1. 重点 突出 ,简单 明了 , 即 一 张 表 一 般 只 表达 一 个 中 心 内 容 和 一 个 主题 。 若 内 容 过 多 ,可 
分 别 制 成 若干 张 表 。 

2. 主 谓 分 明 , 层次 清楚 。 统 计 表 虽然 是 表格 的 形式 , 但 其 内 涵 代 表 的 是 若干 完整 的 文字 语 
句 , 因此 , 主 谓语 的 位 置 要 准确 。 一 般 来 说 , 定语 部 分 放 在 标题 内 , 主语 放 在 表 的 左边 作为 横 标 
目 , 谓语 放 在 右边 作为 纵 标 目 , 横 标 目 与 纵 标 目 交叉 的 格子 放置 数据 , 从 左 向 右 读 , 每 一 行 便 形 
成 一 个 完整 的 句子。 标 目的 安排 及 分 组 要 层次 清楚 ,符合 逻辑 , 便于 分 析 比 较 。 

3. 数据 表达 规范 ,文字 和 线条 尽量 从 简 。 

| ei | 勾 


从 外 形 上 看 ,统计 表 可 由 标题 . 标 目 (包括 横 标 目 、 纵 标 目 )、 线 条 、 数 字 和 备注 5 部 分 构成 ， 
见 表 5-1。 

















加 有 效 例 数 “无 效 例 数 。 ”有 效率 (%) 
对 照 组 103 17 86 16.51 
试验 组 A 74 31 7048 _ 

有 208 91 43.75 








1. 标题 “ 它 是 统计 表 的 总 名 称 , 放 在 表 的 上 方 中 间 位 置 , 简明 扼要 地 说 明 表 的 主要 内 容 ， 
包括 时 间 、 地 点 和 研究 内 容 。 表 的 标题 非常 重要 , 内 容 既 不 能 过 于 简单 , 又 不 要 过 于 繁复 , 尽 
可 能 一 言 切中 所 要 表达 的 目的 和 内 容 。 若 有 多 张 表格 ,标题 前 应 加 上 标号 , 以 方便 引用 , 如 " 表 
5-1" 所 示 。 如 果 表 中 所 有 数据 指标 的 度量 衡 单位 一 致 , 可 以 将 其 放 在 标题 后 面 , 放 于 括号 内 。 

2. 标 目 用 来 说 明 表 内 数据 含义 的 文字 。 横 标 目 位 于 表 的 左 侧 , 说 明 各 行 数据 的 意义 ,如 
表 5-2 中 “医院 1”, “医院 2" 等 , 纵 标 目 位 于 表 头 右 侧 , 如 表 5-2 中 “ 例 数 " “有 效 例 数 " “有 效率 
(% 少 等 。 纵 标 目的 总 标 目 主要 是 对 纵 标 目 内 容 的 概括 , 在 需要 时 才 设置 , 如 表 5-2 中 的 “对 昭 
(安奈 剂 六 “试验 组 "。 标 目 要 尽 可 能 简单 .明了 , 指标 的 单位 要 标示 清楚 , 统计 学 符号 的 使 用 要 

36 
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尽量 规范 , 同时 还 要 兼顾 到 杂志 的 规定 。 

3. 线条 ”撰写 论文 的 统计 表 一 般 采 用 “三 线 表 ”的 格式 , 即 一 张 表格 以 三 条 线 为 基础 , 根据 
内 容 需 要 在 表 内 可 以 适当 附加 1~2 条 细 线 。 表 的 顶 线 和 底线 把 表 的 主要 内 容 与 标题 分 隔 开 , 中 
间 一 条 线 把 纵 标 目 与 数据 分 隔 开 , 不 宜 使 用 竖 线 和 斜 线 。 如 果 某 些 标 目 或 数据 需要 分 层 表示 ， 
可 用 短 模 线 分 隔 ( 见 表 5-2)。 

4. 数字 用 阿拉 伯 数 字 表示 , 位 数 对 齐 , 小 数位 数 一 致 。 表 内 不 留 空格 ,无 数字 用 “-” 表 
示 , 缺失 数字 用 “…" 表示 , 最 好 以 备注 的 形式 说 明 。 若 数字 是 “0”, 则 填写 “0”。 

5. 备注 表 中 数据 区 一 般 不 插入 文字 或 其 他 说 明 , 需要 说 明 时 可 用 “*” 号 标 出 ,将 说 明文 
字 写 在 表格 的 下 面 。 





A cB A 
、 统 计 表 的 种 类 


根据 标 目 的 层次 复杂 程度 , 统计 表 可 以 分 成 简单 表 和 复合 表 。 

1. 简单 表 简单 表 的 标 目 只 有 一 个 层次 , 主语 按 一 个 标志 排列 , 一 般 用 作 横 标 目 , 而 纵 标 
目 为 统计 指标 名 称 , 见 表 5-1。 每 一 行 可 用 一 个 完整 的 句子 表达 , 如 第 一 行 可 读 为 “对 照 组 试验 
的 例 数 为 103 例 , 其 中 有 效 例 数 为 17 例 , 无效 例 数 为 86 例 , 有 效率 为 16.50%”; 第 二 行 可 以 读 
为 “试验 组 的 例 数 为 105 例 , 其 中 有 效 例 数 为 74 例 , 无 效 例 数 为 31 例 , 有 效率 为 70.48%"。 

2. 复合 表 ”复合 表 的 标 目 有 两 个 以 上 层次 , 即 主语 按 多 个 标志 排列 。 复 合 表 有 两 个 或 三 
个 分 组 标志 , 一 般 把 其 中 主要 的 或 分 项 较 多 的 一 个 作为 横 标 目 , 而 其 余 的 则 安排 在 纵 标 目 与 总 
标 目 上 。 如 表 5-2 中 , 将 试验 的 各 医院 和 两 种 不 同治 疗 结合 起 来 分 组 , 可 以 表达 不 同 医院 、 不 同 
处 理 组 别 的 有 效率 , 从 两 个 不 同方 面 进行 分 析 和 对 比 。 


表 5-2 ”试验 药物 与 安慰 剂 治疗 帕 金 森 病 的 多 中 心 临床 试验 结果 

















良民 对 照 组 ( 安慰 剂 ) 试验 组 

例 数 有 效 例 数 。 ”有 效率 ( %) 例 数 有 效 例 数 。” ”有 效率 ( %) 
医院 1 36 6 16.67 36 2 75.00 
医院 2 31 4 12.90 34 2 64.71 
医院 3 36 7 19.44 35 25 7143 
人 计 13 1 1 74 7o4 








统计 表 只 要 满足 编制 原则 、 结 构 合 理 、 能 够 清晰 地 表达 数据 结果 即 可 , 实际 应 用 中 应 注意 
以 下 几 方面 的 问题 。 
1. 统计 表 不 一 定 是 唯一 的 , 同一 数据 经 过 标 目 重 排 或 分 解 组 合 , 可 以 根据 需要 构造 不 同形 
式 的 统计 表 , 表 中 标 目 位 置 的 安排 最 不 易 把 握 , 通常 将 要 比较 的 主体 放 在 表格 最 左边 , 右边 则 
是 相应 的 统计 学 指标 和 实验 数据 , 左右 两 者 位 置 不 宜 颠 倒 , 但 有 时 也 要 视 具体 情况 决定 。 例 如 ， 
表 5-3 和 表 5-4 给 出 的 是 治疗 高 血压 的 临床 试验 中 患者 在 治疗 前 的 舒张 压 和 收缩 压 的 情况 , 使 
用 的 是 两 种 不 同 的 表格 。 表 5-3 是 一 个 比较 规范 的 统计 表 , 从 逻辑 上 看 比较 的 主体 是 试验 组 和 
对 照 组 , 通过 舒张 压 和 收缩 压 的 测量 值 了 解 两 组 是 否 有 所 不 同 ; 而 表 5-4 中 标 目 的 位 置 看 似 有 
些 问 题 , 但 如 果 列 表 的 主要 目的 不 是 比较 试验 组 和 对 照 组 , 重点 是 要 体现 不 同 指标 的 测量 值 ， 
尤其 指标 比较 多 、 标 目 横向 难以 排放 时 , 就 应 该 采用 这 种 格式 。 
2. 避免 内 容 混杂 , 表达 不 清 , 结构 混乱 。 若 标 目 层次 多 于 三 个 以 上 , 统计 表 就 会 变 得 繁 元 ， 


因此 尽量 少 用 。 
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表 5-3 试验 组 和 对 照 组 血压 的 基线 情况 ( 1) 
| E E 
| 分 组 例 数 和 舒张 压 [mmHg) 有 收缩 压 (mmHg) 
| X+S M X+S M 
试验 组 61 98.64 土 4.73 98.0 150.56 土 11.42 149.0 
对 照 组 62 98.31+5.29 96.0 148.23 土 12.43 146.0 
表 5-4 试验 组 和 对 照 组 血压 的 基线 情况 (2) 
指标 下 试验 组 (ni=61) a 对 照 组 ( ns= 62 ) 
| XtS M X+S M 
| 舒张 压 (mmHg) 98.64+4.73 98.0 98.31 土 5.29 96.0 
收缩 压 (mmHg) 150.56+11.42 149.0 148.23 土 12.43 146.0 
例 5-1 某 地 某 年 111 例 钩 端 螺旋 体 病 患者 发 病 季 节 、 年 龄 和 职业 构成 资料 如 表 5-5 所 示 ， 


请 按照 编制 统计 表 的 基本 要 求 , 检查 此 表 编制 是 否 合适 , 如 不 合适 , 加 以 修改 。 
表 5-5 流行 病 学 有 关 的 主要 因素 ( 原 表 ) 
















































































季节 

8 月 上 旬 8 月 中 旬 8 月 下 旬 9 月 上 旬 

人 数 % J 人 数 % 人 数 | % 

记 6.3 70 63.1 28 252 6 | 5.4 

年 龄 ( 岁 ) 
15 以 下 | j= 45 以 上 
人 数 % | 人数 % 人 数 B.S 
12 10.8 | 95 85.6 4 3.6 
职业 
农民 学 生 待业 青年 其 他 
2 人 数 % 人 数 | % 人 数 | % 
106 | 955 1 0.9 3 27 | 1 0.9 























表 5-5 的 缺点 是 : 标题 不 够 明确 , 而 且 未 注 明 时 间 、 地 点 ; @ 发 病 季节 、 年 龄 和 职业 三 项 
指标 无 可 比 性 , 放 在 一 起 , 内 容 繁杂 ; @ 标 目 设计 不 合理 , “人 数 ”"、“%” 多 次 重复 , 不 便于 分 析 对 
比 ; @ 表 内 文字 和 线条 过 多 。 因 此 可 以 将 其 修改 成 表 5-6、 表 5-7 和 表 5-8 三 个 表 。 


表 5-6 ” 某 地 某 年 钩 端 螺旋 体 病 患者 发 病 季 节 分 布 (修改 表 ) 











A 夫 物 人 数 构成 比 (%) 
8 月 上 旬 7 63 
8 月 中 旬 70 63.1 
8 月 下 旬 28 25.2 
9 月 上 旬 6 St 
合计 1 Ee 100.0 





表 5-7” 某 地 某 年 钩 端 螺旋 体 病 患 者 发 病 年 龄 分 布 ( 修改 表 ) 





15 以 下 
15~ 
45 及 以 上 


全 让 


DLA 


人 


构成 比 (%) 

108 
85.6 
36 

1000 


| 
| 
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| 
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表 5-8 某 地 某 年 钓 端 螺旋 体 病 患者 发 病 职 业 分 布 ( 修改 表 ) 














职业 人 数 构成 比 (%) | 
农民 106 95.5 
学 生 1 0.9 
待业 青年 3 2 
其 他 1 0.9 
合计 111 100.0 





例 5-2 某 医院 用 麦芽 根 糖 浆 治疗 急 慢 性 肝炎 患者 161 例 , 疗效 资料 见 表 5-9, 指出 其 缺点 

并 加 以 改进 。 
表 5-9 麦芽 根 糖浆 治疗 急 慢性 肝炎 疗效 观察 ( 原 表 ) 
效果 有 效 
无 

小 计 近期 痊愈 好 转 
总 例 数 、、、| 例 % 例 | % 例 :| % 例 % 
108 67.1 70 | 435 38 23.6 53 32.9 









































此 表 的 主要 目的 是 表达 用 麦芽 根 糖 浆 治疗 急 慢性 肝炎 的 疗效 情况 , 但 是 其 标题 过 于 简单 ， 
主 谓 安排 不 合理 , 标 目 组 合 重复 。 可 进行 如 下 修改 , 见 表 5-10。 


表 5-10 某 年 某 医院 麦芽 根 糖 奖 治疗 急 慢性 肝炎 的 疗效 观察 ( 修改 表 ) 











疗效 例 数 构成 比 (% ) 

无 效 53 32.9 

好 转 38 23.6 
近期 痊愈 70 43.5 

合计 161 100.0 





二 节 统 计 


统计 图 (statistical chart ) 是 把 数据 资料 以 图 示 的 形式 表达 , 使 数据 对 比 更 加 形象 、 直观、 一 
目 了 然 。 统 计 图 利用 点 的 位 置 、 曲 线 的 变化 、 直 条 的 长 短 和 面积 的 大 小 等 几何 图 形 来 表达 统计 
资料 和 指标 , 它 将 研究 对 象 的 特征 、 内 部 构成 、 相 互 关 系 、 对 比 情况 、 频 数 分 布 等 情况 形象 而 生 
动 地 表达 出 来 , 直观 地 反映 出 事物 间 的 数量 关系 , 更 易于 比较 和 理解 。 

“、 统 计 图 的 制作 

(一 ) 统计 图 的 制作 原则 

1. 必须 根据 资料 的 性 质 、 分 析 目 的 选用 适当 的 统计 图 , 由 于 统计 图 不 能 精确 地 显示 数据 大 
小 , 所 以 经 常 需要 与 统计 表 一 起 使 用 。 

2. 一 个 图 通常 只 表达 一 个 中 心 内 容 和 一 个 主题 , 即 一 个 统计 指标 。 

3. 绘制 图 形 应 注意 准确 、 美 观 , 图 线 粗细 适当 , 定点 准确 , 不 同事 物 用 不 同 线条 ( 实 线 、 虚 
线 、 点 线 ) 或 颜色 表示 , 给 人 以 清晰 的 印象 。 

(二 ) 统计 图 的 结构 

统计 图 通常 由 标题 图 域 、 标 目 、 图 例 和 刻度 5 个 部 分 组 成 。 

1. 标题 其 作用 是 简明 扼要 地 说 明 资料 的 内 容 、 时 间 和 地 点 , 一 般 位 于 图 的 下 方 中 央 位 置 














ER 
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并 编号 , 便于 引用 和 说 明 。 

2. 图 域 即 制图 空间 , 除 圆 图 外 , 一 般 用 直角 坐标 系 第 一 象限 的 位 置 表示 图 域 , 或 者 用 长 
方形 的 框架 表示 。 

3. 标 目 分 为 纵 标 目 和 横 标 目 , 表示 纵 轴 和 横 轴 数字 刻度 的 意义 , 一 般 有 度量 衡 单位 。 

4. 图 例 对 图 中 不 同 颜色 或 图 案 代表 的 指标 注释 。 图 例 通常 放 在 横 标 目 与 标题 之 间 , 如 


| 果 图 域 部 分 有 较 大 空间 , 也 可 以 放 在 图 域 中 。 


5. 刻度 “ 即 纵 轴 与 横 轴 上 的 坐标 。 刻 度 可 在 内 侧 或 外 侧 , 刻度 数值 按 从 小 到 大 的 顺序 , 纵 轴 
由 下 向 上 , 横 轴 由 左 向 右 。 绘 图 时 按照 统计 指标 数值 的 大 小 , 适当 选择 坐标 原点 和 刻度 的 间隔 。 

(三 ) 统计 图 的 种 类 

医学 中 常用 的 统计 图 有 直 条 图 、 百 分 条 图 、 贺 图、 普通 线 图 、 半 对 数 线 图 、 直 方 图 、 箱 式 图 、 
误差 条 图 和 散 点 图 等 ; 还 有 一 些 特殊 的 统计 图 , 如 表达 多 个 试验 中 心 研究 结果 的 森林 图 、 生 存 


| 分 析 中 的 生存 曲线 图 、 聚 类 分 析 的 树 形 图 等 。 一 般 应 根据 资料 的 性 质 和 分 析 目 的 选择 适当 的 图 


形 。 以 下 仅 介绍 医学 中 常用 的 统计 图 。 
二 、 描 述 定量 数据 的 统计 图 
(一 ) 直方 图 


直方 图 (histogram) 用 直 条 和 矩形 面积 代表 各 组 频数 ,各 矩形 面积 总 和 代表 频数 的 总 和 。 它 主 
要 用 于 表示 连续 变量 频数 分 布 情况 , 如 根据 频数 表 5-11 绘制 成 频数 分 布 图 5-1。 从 图 5-1 可 以 


| 看 出 ,该 市 3 岁 女孩 身高 主要 分 布 在 92cm 左右 , 位 于 84~100cm 之 间 者 约 占 总 数 的 95%。 为 了 


对 比 两 组 的 频数 分 布 情况 , 也 可 以 根据 表 5-12 将 两 个 直方 图 用 图 5-2 一 张 图 表示 。 结 果 显 示 ， 
eh rp en 人 ,而 且 可 以 明显 看 出 两 组 人 糖化 血红 




















量 数值 分 布 的 差异 。 
表 5-11 某 市 某 年 150 名 3 岁 女 孩 身 高 的 频数 分 布 
组 段 (cm) 频数 | 组 段 (cm) 频数 

80~ 1 | 94~ 24 
82~ 3 | 96~ 17 
84~ 8 | 98~ 10 
86~ 10 100~ 6 
88~ 19 | 102~ 2 
90~ 23 | 104~106 1 
92~ 26 

30r 


频数 
四 
i 








4 
| 


| | | 站 
| | 3 
二 去 82 84 86 88 90 92 94 96 98 100 102 104 


身高 (cm) 
5-1 某 市 某 年 150 名 3 岁 女 孩 身高 频数 分 布 








到 
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表 5-12 ”糖尿 病 患者 和 正常 对 照 HbA1c( % ) 分 布 










































































es | 
频数 | 频数 
组 段 二 | 组 段 江 
糖尿 病 正常 | 糖尿 病 正常 
<4.0 1 20 | 7.6~ 12 1 
Dy 2 28 | 10 1 
5.6~ 3 27 | 8.4~ 3 0 
6.0~ 3 13 | 8.8~ 4 0 | 
6.4~ 7 6 | 92~ 8 0 | 
6.8~ 7 闪 | 9.6~ 5 0 | 
| | 
7.2~ 16 2 | 10.0~12.8 19 0 | 
糖尿 病 患 者 i 正常 对 照 
10.2 
9.8 
9.4 | 
9.0 
8.6 
8.2 | 
76 呈 
72 | 
6.8 
6.4 1 
6.0 | 
5.6 | 
六 之 
4.0 
as RE we 一 一 
30 20 10 0 0 10 20 30 
频数 


图 5-2 ”糖尿 病 患者 和 正常 对 照 HbA1c( % ) 的 频数 分 布 


绘制 直方 图 时 应 注意 : 纵 轴 的 刻度 必须 从 “0" 开始 , 而 横 轴 的 刻度 按 实际 范围 制定 ; 各 年 形 | 
的 高 度 为 频数 或 频率 , 宽度 为 组 距 。 如 果 各 组 段 的 组 距 不 同 要 调整 各 矩形 的 高 , 矩形 高 度 = 组 
段 频数 /组 距 。 

(二 ) 线 图 

线 图 (line chart ) 是 用 线段 的 升降 来 表示 指标 ( 变量 ) 的 连续 变化 情况 ,适用 于 描述 一 个 变量 
随 另 一 个 变量 变化 的 趋势 。 通 常 纵 坐标 是 统计 指标 , 横 坐 标 是 时 间 变 量 。 普 通 线 图 的 坐标 都 按 
算术 尺度 标记 刻度 , 若 纵 坐标 按 对 数 尺度 (通常 采用 常用 对 数 ), 横 坐标 按 算术 尺度 , 制作 的 线 
图 为 半 对 数 线 图 (semi-logarithmic linear chart )。 如 根据 表 5-13 绘制 成 的 图 5-3 为 普通 线 图 。 





死亡 率 (1/10 万 ) 死亡 率 (110 万 ) 
年 份 ed 
ee 女 | 人 
1968 50.19 37.54 1972 35.59 24.08 
1969 42.97 25.00 | 1973 38.31 24.10 
1970 45.37 27.88 1974 25.29 16.00 


1971 4442 25.10 ey 
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死亡 率 (1/10 万 ) 





1968 1969 1970 1971 1972 1973 1974 
年 份 


图 5-3 某 地 1968 一 1974 年 结核 病死 亡 率 


对 于 相对 数 指标 , 用 普通 线 图 有 时 难以 准确 表达 和 对 比 不 同 变量 的 变化 速度 , 这 时 可 以 使 
用 半 对 数 线 图 。 如 将 表 5-14 的 数据 绘制 成 普通 线 图 (图 5-4), 呈现 出 白喉 死亡 率 比 伤寒、 副 伤 
寒 死亡 率 下 降 速度 快 ; 如 果 绘 制 成 半 对 数 线 图 (图 5-5), 则 白喉 死亡 率 与 伤寒 、 副 伤寒 死 亡 率 变 














化 快慢 速度 相差 不 大 。 
表 5-14 某 地 1949 一 1958 年 白喉 , 伤寒 、 副 伤寒 的 死亡 率 

| 年 份 自 吃 伤寒 、 副 伤寒 

| 死亡 率 ( 1/10 万 ) 对 数值 死亡 率 (1/10 万 ) 对 数值 
1949 3.3 0.5185 | 0.0414 
1950 5.9 0.7709 0.9 一 0.0458 
1951 8.4 0.9243 1.9 0.2788 
1952 3.9 0.5911 1.0 0.0000 
1953 D3 0.3979 0.7 —0.1549 
1954 1.5 0.1761 0.6 —0.2218 
1955 3.3 0.5185 0.6 —0.2218 
1956 站 | 0.0414 0.2 一 0.6990 
1957 1.0 0.0000 0.3 —0.5229 
1958 0.6 —0.2218 0.05 -1.3010 





-…o-… 伤寒 、 副 伤寒 





死亡 率 (1/10 万 ) 


由、 






DO 世 


0 -- s 
1948 1950 1952 1954 1956 1958 1960 
年 份 


图 5-4 某 地 1949 一 1958 年 白喉 、 伤寒 、 副 伤寒 死 亡 率 线 图 


绘制 线 图 时 应 注意 : 横 轴 代表 分 组 标志 , 纵 轴 代 表 统计 指标 ; 横 轴 和 纵 轴 的 刻度 都 可 以 不 
从 “0" 开始 ; 用 短线 依次 将 相 邻 各 点 连接 即 得 线 图 , 不 应 将 折线 描 成 光滑 曲线 。 线 图 中 车 只 丰 
一 条 折线 , 称 为 单 式 线 图 ; 若 有 两 条 及 以 上 的 线条 , 称 为 复式 线 图 。 在 绘图 时 ,需要 注意 纵横 轴 
比例 , 比例 不 同 , 给 人 的 印象 也 不 同 。 
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一 0… 伤寒 、 副 伤寒 







Ee 
= 0.5 
0 9- -4 -一 
证 1948 1950 1952 “……-o、1956 1960 
tH -05 1954 ~ a 1958 
让 年 从 

1 人 

b 
-1.5 


5-5 ” 某 地 1949 一 1958 年 白喉 、 伤寒 、 副 伤寒 死亡 率 半 对 数 线 图 


(三 ) 箱 式 图 
箱 式 图 (box plot) 用 于 比较 两 组 或 多 组 资料 的 集中 趋势 和 离散 趋势 , 主要 适用 于 描述 偏 态 
分 布 的 资料 。 箱 式 图 的 中 间 横 线 表示 中 位 数 , 箱 体 的 长 度 表 示 四 分 位 数 间距 , 两 端 分 别 是 Ps 
和 Ps。 最 外 面 两 端 连 线 有 两 种 表示 方法 : 一 种 是 表示 最 大 值 和 最 小 值 ; 另 一 种 是 去 除 离 群 值 
后 的 最 大 值 和 最 小 值 , 对 离 群 值 另 作 标记 。 离 群 值 可 定义 为 大 于 Pys+1.58 或 小 于 Ps 1.52， 
2 为 四 分 位 数 间距 。 显 然 箱 体 越 长 表示 数据 离散 程度 越 大 ; 中 间 横 线 若 在 箱 体 中 心 位 置 , 表示 








数据 分 布 对 称 , 中 间 横 线 偏离 箱子 正中 心 越 远 , 表示 数据 分 布 越 偏离 中 位 数 。 箱 式 图 的 纵 轴 起 


点 不 一 定 从 “0" 开始。 根据 表 5-15 绘制 成 的 图 5-6 可 以 看 出 , 大 白鼠 肝 肿 癌 中 递 甲 氨 酶 的 活 度 
(CPM) 明 显 高 于 正常 肝 中 递 甲 氨 酶 的 活 度 , 而 且 数 据 的 变异 性 很 大 , 并 有 1 个 离 群 值 。 


表 5-15 大 白鼠 正常 肝 和 肝 肿瘤 中 递 甲 氨 酶 ( CPM ) 的 活 度 


























正常 肝 肿瘤 肝 | 正常 肝 肿瘤 时 
19 227 91 104 
30 339 35 211 
43 130 68 346 
70 592 15 133 
64 405 | 6 814 

3 © 
8 
呈 
5 
由 
入 时 
访 
感 
因 
8 
qq 
a 
Ea 
eg T 一 一 
正常 肝 肿瘤 肝 


图 5-6 ”大 白鼠 正常 肝 和 肝 肿 瘤 中 递 甲 氨 酶 的 活 度 ( CPM) 


人 
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(四 ) 误差 条 图 

误差 条 图 (error bars ) 用 于 比较 多 组 资料 的 均值 和 可 信 区 间 , 用 线条 的 高 度 表示 均值 的 大 
小 , 可 以 用 "“ 工 "表示 可 信 区 间 , 上 端 “ 一 "表示 可 信 区 间 的 上 限 , 下 端 “一 ”表示 可 信 区 间 的 下 
限 , 中 间 “的 长 度 表示 可 信 区 间 的 长 度 ( 参 见 第 六 章 )。 另 一 种 表示 方法 , 可 以 用 “T” 字 图 部 分 
表示 均 数 的 标准 误 (SE = 8S/Va )。 误 差 条 图 有 若干 种 表现 方法 , 本 例 选择 在 撰写 论文 时 常用 的 
方法 , 即 根据 表 5-16 中 的 数据 计算 出 的 均 数 和 标准 误 绘制 误差 条 图 (图 5-7), 从 图 中 可 看 出 试 
验 组 降 压 的 平均 值 高 于 对 照 组 。 

绘制 误差 条 图 时 应 注意 : 如 果 以 横 轴 为 基线 , 表示 各 个 分 组 或 标志 , 纵 轴 则 表示 各 标志 相 
应 的 均值 和 标准 误 ( 或 可 信 区 间 ); 纵 轴 尺度 必须 从 “0” 开始 , 表示 均值 的 各 直 条 的 宽度 要 相等 ， 
直 条 之 间 的 间隔 不 必 等 距 。 














表 5-16 试验 组 和 对 照 组 6 周 后 血压 (mmHg ) 的 变化 情况 














试验 组 对 照 组 | 试验 组 对 照 组 
舒张 压 。 ”收缩 压 。 ”千张 压 。” ”收缩 压 | 千张 压 收缩 压 。 舒张 压 ”收缩 压 
12 17 10 10 8 20 7 10 
12 8 -4 Ey 也 1 6 10 
10 19 8 21 9 26 8 8 
0 24 12 二 44 -4 6 
16 9 10 -11 | 6 入 8 15 
10 20 10 6 | 14 15 8 16 
14 19 16 25 16 26 11 10 
14 19 12 12 | 20 27 -4 3 
11 14 10 7 9 10 11 25 
2 8 到 让 之 9 9 5 








血压 下 降 值 (mmHe) 














舒张 压 收缩 压 
图 5-7 试验 组 和 对 照 组 血压 的 平均 变化 情况 ( 卫 +SE) 


《五 图 

散 点 图 (scatter plot) 用 点 的 密集 程度 和 变化 趋势 表示 两 指标 之 间 的 直线 或 曲线 关系 ,如 根 
据 表 5-17 绘制 成 图 5-8。 结 果 显示 , 随 着 载 脂 蛋白 B 含量 的 增加 , 高 血脂 患者 低 密度 脂 蛋白 的 
含量 也 相应 增加 。 

绘制 散 点 图 时 应 注意 : 纵 轴 和 横 轴 各 代表 一 种 事物 , 横 轴 代表 自 变 量 , 纵 轴 代 表 因 变量 ; 纵 
轴 和 横 轴 的 起 点 , 不 一 定 从 “0" 开始 。 
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表 5-17 高 血脂 患者 载 脂 蛋白 B 与 低 密度 脂 蛋 白 的 关系 























Apo-B( g/L) LDL(mmol/L) | Apo-B( g/L) LDL( mmol/L ) 
0.80 2.98 | 0.66 2.28 
0.60 2.76 | 0.67 2.34 
0.90 3.22 | i 4.84 
0.80 3.84 | 0.97 3.89 
0.90 3.12 | 0.80 2.14 
0.90 4.18 | 0.94 3.60 
0.70 2.00 0.82 2.30 
0.70 2.94 0.79 3.30 
0.80 3.12 | 0.76 2.20 
1.21 5.33 0.80 2.12 

6 
© 
全 3 。 
是 3 
:2 © 
所 3 2 @ o° 
1 和 一 一 一 一 
0.5 0.75 1 125 
载 脂 蛋白 B(g/D) 


图 5-8 20 名 高 脂 血 症 患者 载 脂 蛋白 B 与 低 密度 脂 蛋白 关系 的 散 点 图 


三 、 描 述 定性 数据 的 统计 图 


(一 ) 直 条 图 


直 条 图 (bar chart) 又 称 条 图 , 用 等 宽 直 条 的 长 短 来 表示 相互 独立 的 统计 指标 数值 大 小 和 它 
们 之 间 的 对 比 关系 。 直 条 图 按 直 条 是 横 放 还 是 竖 放 分 为 卧 式 和 立 式 两 种 , 按 分 组 因素 的 多 少 
分 为 单 式 和 复式 两 种 。 主 要 适用 于 各 自 独立 的 统计 指标 。 指 标 既 可 以 是 绝对 数 , 也 可 以 是 相对 
数 。 常 用 的 直 条 图 有 两 种 。 

1. 单 式 条 图 “具有 一 个 统计 指标 , 一 个 分 组 因素 。 如 根据 表 5-18 绘制 成 的 图 5-9, 描述 按 
地 区 分 组 的 发 病 率 。 











~ SD [2 
mu S a 


发 病 率 (1/10 万 ) 
Ss 





甲 地 区 乙 地 区 丙 地 区 丁 地 区 





图 5-9 某 省 某 年 四 个 地 区 霄 髓 灰质 炎 发 病 率 
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表 5-18 某 省 某 年 四 个 地 区 背 信 灰 质 炎 发 病 率 











地 区 发 病 率 (1/10 万 ) | 和 发 病 率 ( 1/10 万 ) 
甲 22.0 dj， 1.5 
己 4.5 1.0 








2. 复式 条 图 具有 一 个 统计 指标 , 两 个 分 组 因素 。 如 根据 表 5-19 绘制 成 的 图 5-10。 
表 5-19 某 地 区 1952 年 与 1972 年 三 种 疾病 的 死亡 率 























死因 死亡 率 ( 1/10 万 ) 4 
1952 年 1972 年 二 
肺结核 163.2 27.4 
心脏 病 2 82.5 
恶性 肿瘤 5 183.5 
200 
150 
§ 
| 是 100 
用 
| 户 5s0 国 
| 隔世 | 
0 
| 肺结核 心脏 病 恶性 肿瘤 


口 1952 年 口 1972 年 


图 5-10 某 地 1952 年 与 1972 年 三 种 疾病 死亡 率 比较 


绘制 直 条 图 时 应 注意 : 一 般 以 横 轴 为 基线 , 表示 各 分 组 , 纵 轴 表示 各 分 组 相应 的 值 ; 纵 轴 尺 
度 必须 从 “0" 开始, 而 且 要 等 距 ; 直 条 的 宽度 要 相等 , 直 条 的 间隔 要 等 距 , 间隔 的 距离 通常 与 直 
条 的 宽度 相等 或 略 小 。 

(二 ) 构成 图 

构成 图 常用 于 描述 构成 比 资料 。 常 用 的 构成 图 有 圆 图 (pie chart) 和 百 分 条 图 (percentage bar 
chart )。 

1. 圆 图 把 圆 的 总 面积 作为 100%, 表示 事物 的 全 部 , 而 圆 内 各 扇形 面积 用 来 表示 全 体 中 
各 部 分 所 占 的 比例 。 如 根据 表 5-20 单纯 型 老年 性 气管 炎 疗 效 绘制 成 图 5-11。 








表 5-20 ”复方 猪 胆 胶囊 治疗 老年 性 气管 炎 近 期 疗效 比较 











de eb mm 

Re MR 构成 比 (%) 例 数 ”构成 比 %) 
临床 治愈 60 27.15 23 12.64 
显效 98 44.34 82 45.06 
有 效 51 23.08 66 36.26 
无 效 12 5.43 11 6.04 
人 2 000 182 10000 








ee 绘制 方法 : 以 贺 形 的 360* 角 为 100%, 将 各 构成 部 分 的 构成 比 (%) 乘 以 3.6* , 即 得 各 组 
A ro 心 角 度数 ; 再 以 某 刻度 ( 比如 相当 于 时 钟 12 时 的 位 置 ) 为 起 点 , 顺 时 针 按 圆心 角 
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口 临 床 治愈 口 显效 加 有 效 口 无 效 
图 5-11 复方 猪 胆 胶囊 治疗 单纯 型 老年 气管 炎 近 期 疗效 比较 


度数 大 小 或 者 自然 顺序 排列 各 个 扇形 。 不 同 的 扇形 可 以 用 不 同 的 颜色 或 花纹 区 别 , 也 可 以 简要 
注 明 文字 和 百分比 。 

2. 百 分 条 图 “用 矩形 直 条 的 长 度 表 示 100%, 而 用 其 中 分 割 的 各 段 表示 各 构成 部 分 的 百 分 
比 。 如 根据 表 5-20 绘制 成 的 图 5-12。 














构成 比 %g) 
日 临床 治愈 ” 口 显效 ”日 有 效 ” 口 无 效 


图 5-12 复方 猪 胆 胶 训 治疗 老年 性 气管 炎 近 期 疗效 比较 


百 分 条 图 绘制 方法 : 绘制 一 条 等 宽 的 水 平 直 条 , 其 长 度 为 100%, 根据 各 部 分 所 占 百 分 比 ， 
人 小 或 资料 的 自然 顺序 把 直 条 分 成 若干 段 ， 然后 在 直 条 < 的 各 分 段 上 标 出 百分比 。 同 一 指标 
分 层 相互 比较 时 ,可 以 绘制 多 个 直 条 。 








练习 题 
、 单 项 选择 题 
1. 统计 表 的 主要 作用 是 ( ) 
A. 便于 形象 描述 和 表达 结果 B. 客观 表达 实验 的 原始 数据 
C. 减少 论文 篇 幅 D. 容易 进行 统计 描述 和 推断 


E. 代替 宛 长 的 文字 和 手 述 和 便于 分 析 对 比 
2. 描述 某 疾 病 患 者 年 龄 ( 岁 ) 的 分 布 ,应 采用 的 统计 图 是 ( ) 

















笔记 
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有 和 何 缺 点 ， 


A. 线 图 

C. 百 分 条 图 

E. 箱 式 图 
3. 高 


B. 直 条 图 
D. 直方 图 


血压 临床 试验 分 为 试验 组 和 对 照 组 , 分 析 考 虑 治疗 0.2.4、6、8 周 血 压 的 动态 变化 和 


改善 情况 , 为 了 直观 显示 出 两 组 血压 平均 变动 情况 , 宜 选 用 的 统计 图 是 ( ) 


A. 半 对 数 图 
C. 直 条 图 
E. 百 分 条 图 


B. 线 图 
D. 直方 图 


4. 研究 三 种 不 同 麻醉 剂 在 麻醉 后 的 镇 痛 效 果 , 采用 计量 评分 法 ,分 数 呈 偏 态 分 布 , 比较 终 
点 时 分 数 的 平均 水 平 及 个 体 的 变异 程度 , 应 使 用 的 图 形 是 ( ) 


A. 复式 条 图 
C. 散 点 图 
E. 箱 式 图 


B. 复式 线 图 
D. 直方 图 


5. 研究 血清 低 密 度 脂 蛋白 LDL 与 载 脂 蛋 白 B-100 的 数量 依存 关系 , 应 绘制 的 图 形 是 ( ) 


A. 直方 图 

C. 线 图 

E. 直 条 图 
6. 


A. 直方 图 
C. 误差 条 图 、 条 图 


E. 加 图 、 百 分 条 图 





B. 箱 式 图 
D. 散 点 图 


下 列 统计 图 适用 于 表示 构成 比 关系 的 是 ( 。 ) 


B. 箱 式 图 
D. 散 点 图 、 线 图 


7. 对 有 些 资料 构造 统计 表 时 ,下 列 哪 一 项 可 以 省 略 ( ) 


A. 标题 
C. 线条 
E. 备注 


B. 标 目 
D. 数字 


8. 绘制 下 列 统计 图 纵 轴 坐标 刻度 必须 从 “0” 开始 的 有 (  ) 


A. 圆 图 
C. 线 图 
E. 直方 图 
9. 描述 某 现 象 频数 分 布 情况 可 选择 ( 
A. 圆 图 
C. 箱 式 图 


E. 直方 图 





10 
长 、 咽 痛 和 发 热 的 有 效 : 
C. 箱 式 图 
E. 直方 图 
二 、 改 表 和 绘图 
1. 某 地 调查 





B. 百 分 条 图 
D. 半 对 数 线 图 


) 
B. 百 分 条 图 
D. 误差 条 图 


. 对 比 菜 种 清热 解毒 药物 和 对 照 药物 的 疗效 ,其 单项 指标 为 口 渴 、 身 痛 、 头 痛 、 咳 嗽 、 流 
,应 选用 的 统计 图 是 (。 ) 


B. 百 分 条 图 
D. 复式 条 图 


程度 与 血 片 查 首 原 贝 结果 列表 如 下 ,此 表 
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某 地 | 



































血 膜 阳 性 合计 | 
恶性 症 闻 日 症 
例 数 % | 
例 数 % 例 数 % | | 
28 12.6 20 9.04 222 48 21.6 | 
8 6.6 9 7.40 122 17 13.9 | | 
14 20.0 5 7.10 70 19 27:1 | 
6 23.1 5 19.20 26 11 42.3 | 
其 他 3 0 0.0 1 25.00 4 | 25.0 | 
2. 试 根据 下 表 资 料 绘制 适当 统计 图 形 | 





某 地 1975 年 839 例 正常 人 发 东 值 (g/g ) 分 布 资料 | 





组 段 0~ 02~ 04 06~, 08 10~ 12% 14~ 16-22 合计 
例 数 133 193 190 111 33 34 43 16 36 839 








3. 根据 下 表 分 别 绘制 普通 线 图 和 半 对 数 线 图 , 并 说 明了 两 种 统计 图 型 的 意义 








某 地 某 年 食管 癌 不 同性 别 与 年 龄 别 的 发 病 率 | | 
| 








年 龄 ( 岁 ) 发 病 率 ( 1/10 万 ) | 
男 | 
40~ 4.4 | | 
45~ ?过 33 | 
50~ 广 尊 4.5 
55~ 6.9 5 
60~ 19.3 6.7 | 
65~ 50.2 16.4 | 
70~ 68.5 12.5 | 
75~ 86.2 19.9 
80~ 97.0 15.2 | 











( 张 焉 德 ” 刘 拖 ) 








第 玉音 “参数 估计 与 假设 检验 -| 


本 章 开始 学 习 统计 推断 方法 , 内 容 涉及 参数 估计 和 假设 检验 的 基本 概念 和 原理 。 参 数 估计 
指 由 样本 统计 量 估 计 总 体 参数 , 是 统计 推断 的 重要 内 容 之 一 , 常用 的 方法 有 点 估计 和 区 间 估 计 。 
区 间 估 计 是 指 按 预先 给 定 的 概率 , 计算 出 一 个 区 间 , 使 它 能 够 包含 未 知 的 总 体 参 数 。 假 设 检验 
是 统计 推断 的 另 一 重要 内 容 , 其 目的 是 比较 总 体 参数 之 间 有 无 差别 。 


第 一 节 参数 估计 


一 抽样 误差 


在 医学 研究 中 , 绝 大 多 数 情况 是 由 样本 信息 推断 总 体 特征 。 由 于 个 体 存在 差异 , 因此 通过 
样本 推论 总 体 时 会 存在 一 定 的 误差 , 如 样本 均 数 筷 往 往 不 等 于 总 体 均 数 人 , 这 种 由 抽样 造成 的 
样本 统计 量 与 总 体 参数 的 差异 称 为 抽样 误差 (sampling error)。 例 如 ,假设 健康 成 年 男子 的 红 细 
胞 服从 均 数 为 y=4.75 x 10L, 标准 差 o=0.38 x 1021L 的 正 态 分 布 , 现 随机 抽取 140 人 ,计算 红 
细胞 的 样本 均 数 为 蕊 =4.77x 10'3L, 两 值 之 差 0.02 x 10'3L 即 为 抽样 误差 。 可 以 设想 , 若 再 随机 
抽取 140 名 成 年 男子 进行 测量 , 甚 平均 红细胞 数 会 是 另 一 不 同 的 结果 。 对 于 抽样 研究 , 抽样 误 
差 是 不 可 避免 的 。 

(一 ) 均 数 的 标准 误 

如 何 能 精确 地 估计 成 年 男子 红细胞 数 的 总 体 均 数 ? 因为 存在 抽样 误差 , 基于 140 例 研究 
对 象 的 样本 均 数 不 可 能 与 总 均 数 完全 一 样 , 问题 是 我 们 能 否 知道 估计 值 的 精确 程度 , 对 此 可 以 
利用 抽样 误差 的 分 布 规律 对 其 进行 分 析 。 理 论 上 可 以 证 明 : 若 从 正 态 总 体 Ww, 只 ) 中 ,反复 多 
次 随机 抽取 样本 含量 固定 为 n 的 样本 ,那么 这 些 样本 均 数 卫 也 服从 正 态 分 布 , 即 也 的 总 体 均 
数 仍 为 1, 样本 均 数 的 标准 差 为 a/Vn。 则 根据 中 心 极限 定理 : 在 样本 含量 很 大 的 情况 下 (如 
n>50), 无 论 原始 测量 变量 服从 什么 分 布 , 筷 的 抽样 分 布 都 近似 服从 正 态 分 布 NG, oz/z)。 

统计 学 中 为 了 区 别 个 体 观察 值 之 间 变 异 的 标准 差 与 反映 样本 均 数 之 间 变 异 的 标准 差 , 将 后 
者 称 为 均 数 的 标准 误 (standard error of the mean )。 显 然 , 标准 误 小 于 原始 测量 值 的 标准 差 , 标准 
误 越 小 说 明 估 计 越 精确 , 因此 可 以 用 均 数 的 标准 误 表 示 均 数 抽样 误差 的 大 小 。 均 数 的 标准 误 用 
符号 oz 表示 , 计算 公式 为 





























是 (6-1) 
由 式 (6-1) 可 见 ,在 样本 含量 一 定 的 情况 下 , 均 数 的 标准 误 与 标准 差 成 正比 , 说 明 当 总 体 中 各 观 
测 值 变异 较 小 时 , 抽 到 的 样本 均 数 雹 与 总 体 均 数 / 可 能 相差 较 小 ,用 元 估计 4 的 可 靠 程度 较 高 ; 
当 总 体 中 各 观测 值 变异 较 大 时 , 抽 到 的 样本 均 数 区 与 总 体 均 数 / 可 能 相差 很 大 , 用 筷 估 计 w 的 
可 靠 程度 也 相对 较 低 。 均 数 的 标准 误 与 样本 含量 的 平方 根 Vn 成 反比 ,说 明 在 同一 总 体 中 随机 
抽样 ,样本 含量 % 越 大 ,标准 误 越 小 。 均 数 的 标准 误 反映 了 样本 均 数 间 的 离散 程度 , 也 反映 了 样 
本 均 数 与 总 体 均 数 的 差异 。 

实际 中 , 总 体 标准 差 o 往往 未 知 , 因而 通常 用 样本 标准 差 8 代替 o, 求 得 样本 均 数 标准 误 的 
估计 值 Sr, 计算 公式 为 
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Ss 
可 

Se (6-2) 

例 6-1 在 某 地 随机 抽查 成 年 男子 140 人 , 得 红细胞 均 数 4.77x 10"L, 标准 差 0.38 x 102/L， 
试 计算 其 标准 误 。 
按 公 式 (6-2) 计 算得 : 
Ss 0.38 
S- = 二 = 一 二 =0.032(x102/L) 
* Vn V40 2 


(二 ) 率 的 标准 误 

样本 率 的 标准 差 称 为 率 的 标准 误 (standard error of rate )， 可 用 来 描述 样本 率 抽样 误差 的 大 
小 。 率 的 标准 误 越 小 , 则 率 的 抽样 误差 越 小 ; 率 的 标准 误 越 大 , 则 率 的 抽样 误差 越 大 。 现 记 总 
体 率 参 数 为 x, 样本 率 为 p; 在 n 次 独立 重复 试验 中 出 现 的 “阳性 ”次 数 记 为 X, 则 样本 率 为 


p= (6-3) 
样本 率 p 的 总 体 方差 为 
_ TU- (6-4) 
n 


Pp 的 总 体 标准 差 ( 即 率 的 标准 误 ) 为 





= lzd-n) (6-5) 
n 


在 一 般 情况 下 , 总 体 率 x 往往 是 未 知 的 , 此 时 可 用 样本 率 p 来 代替 总 体 率 z, 则 wm 的 估计 


值 为 
ee pd-p) (6-6) 
rn 


无 论 是 均 数 的 标准 误 还 是 率 的 标准 误 , 都 是 抽样 分 布 的 重要 特征 之 一 , 它 可 用 于 参数 的 区 
间 估 计 和 不 同 组 之 间 参 数 的 比较 。 


二 、 可 信 区 间 的 概念 


参数 估计 (parameter estimation ) 指 由 样本 统计 量 估计 总 体 参 数 ， 是 统计 推断 的 重要 内 容 之 
一 。 常 用 的 估计 方式 有 两 种 : 点 估计 (point estimation ) 和 区 间 估 计 (interval estimation 5 

点 估计 是 使 用 单一 的 数值 直接 作为 总 体 参数 的 估计 值 , 如 用 马 估 计 相应 的 人 ,用 忆 估计 相 
应 的 x。 该 法 表达 简单 ,但 未 考虑 抽样 误差 的 影响 ， 无 法 评价 参数 估计 的 准确 程度 o 

区 间 估 计 是 指 按 预 先 给 定 的 概率 , 计算 出 一 个 区 间 , 使 它 能 够 包含 未 知 的 总 体 参 数 。 事 先 
给 定 的 概率 1 一 a 称 为 可 信 度 (通常 取 0.95 或 0.99), 计算 得 到 的 区 间 称 为 可 信和 区间 (confidence 
interval, CI)。 可 信 区 间 通 常 由 两 个 数值 界定 的 可 信 限 (confidence limit ) 构 成 , 其 中 数值 较 小 的 
一 方 称 为 下 限 , 数值 较 大 的 一 方 称 为 上 限 。 总 体 均 数 估计 的 95% 可 信 区 间 表示 该 区 间 包 括 总 
体 均 数 4 的 概率 为 95%, 即 若 作 100 次 抽样 算得 100 个 可 信 区 间 , 则 平均 有 95 个 可 信 区 间 包 括 
4 估计 正确 ), 只 有 5 个 可 信 区 间 不 包括 (估计 错误 )。 例 如 , 估计 某 地 成 年 男子 的 红细胞 平均 
水 平 ,其 95% 的 可 信 区 间 为 471 x 1031~4.83x 102/L, 说 明 总 体 红细胞 均 数 被 包含 在 这 一 区 间 





























的 概率 为 95%。 
可 信 区 间 估计 的 效果 ,一 是 由 可 信和 度 1-a 来 反映 , 即 计算 出 的 区 间 包括 总 体 均 数 w 的 概率 


今 时 


大 小 , 其 值 越 接近 1 越 好 ; 二 是 由 区 间 的 宽度 来 反映 , 区 间 越 窗 说 明 估 计 越 精确 。 在 样本 含量 一 





定 的 情况 下 , 二 者 是 矛盾 的 , 车 仅 考 虑 提高 可 信 度 , 则 使 估计 的 区 间 变 宽 , 从 而 降低 了 使 用 可 信 | 





| 
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| 区 间 的 价值 。 一 般 情 况 下 , 95% 可 信 区 间 较 为 常用 ; 在 可 信 度 确定 的 情况 下 , 增加 样本 量 可 以 
| 缩小 区 间 宽 度 , 从 后 面 区 间 估计 的 计算 公式 可 以 更 清楚 地 看 到 这 一 点 。 


三 、 总 体 均 数 的 区 间 估 计 


总 体 均 数 p 可 信 区 间 的 计算 公式 可 以 利用 了 XY 的 抽样 分 布 获得 。 实 际 中 ,总体 均 数 可 信和 区间 
的 计算 方法 ,根据 总 体 标准 差 "是 否 已 知 , 以 及 样本 量 的 大 小 而 有 所 不 同 。 








(一 ) oe 已 知 
如 果 变 量 卫 服从 均 数 为 4 标准 差 为 o 的 正 态 分 布 , 则 
无 -4 
6-7 
< (6-7) 
| 服从 标准 正 态 分 布 。 按 照 标准 正 态 分 布 规律 ,95% 的 z 值 在 -1.96 和 1.96 之 间 , 即 
| 一 * 
| "sc = <196]-0%s (6-8) 
oO n 
PI-1.96-<y<X 196]-0 95 
( 人 
从 而 得 到 95% 可 信 区 间 ; 
(X—1.9607, FY+1.9607) (6-9) 
更 一 般 的 情况 : 
(X— Zi120xs + Za207) (6-10) 








其 中 zu 为 标准 正 态 分 布 的 双 侧 界 值 。 若 取 1- xc= 0.95, 则 为 总 体 均 数 的 95% 可 信和 区间 ,或 取 
1 一 x=0.99, 则 为 总 体 均 数 99% 可 信 区 间 。 需 要 注意 的 是 ,/ 不 是 一 个 随机 变量 , 而 是 包含 在 可 
信 区 间 内 的 一 个 参数 值 。 

(二 ) c 未 知 

事实 上 , 总 体 标准 差 "通常 是 未 知 的 , 这 时 我 们 可 以 用 其 估计 量 8 代替 o, 但 在 这 种 情况 
下 ,(X 一 /D1(S/Vn) 已 不 再 服从 标准 正 态 分 布 ,而 是 服从 著名 的 1 分 布 。 
1. 分布 1 分 布 (t-distribution) 由 英国 统计 学 家 W. S. Gosset 于 1908 年 以 “Student” 笔名 提 
出 ,他 证 明了 在 正 态 分 布 总 体 中 进行 抽样 ,( 卫 -D/CS/V7) 服 从 自由 度 为 v=n 一 1 的 :分布 。1 分 
布 是 以 0 为 中 心 的 对 称 分 布 ,参见 图 6-1。 











fl) 05 
y= 中 标准 正 态 分 布 
0.411 访 
03 v=1 
0.1 
a SS 
E 0 2 4 


图 6-1 不 同 自由 度 的 上 分 布 图 














图 6-1 可 见 , 1 分 布 曲线 的 形态 变化 与 自由 度 v=n 一 1 有 关 。 随 着 自由 度 v 的 增 大 ,上 分布 
曲线 越 来 越 接 近 于 标准 正 态 分 布 曲线 ; 当 v 一 oo 时 ,1 分 布 的 极限 分 布 就 是 标准 正 态 分 布 。 因 
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此 ,1 分 布 曲线 下 面积 95% 的 界 值 不 是 一 个 常量 , 它 随 自由 度 大 小 不 同 而 变化 。 为 了 应 用 方便 ， 
可 根据 附 表 2 查找 相应 的 + 界 值 。t 界 值 表 中 ,给 出 了 不 同 自 由 度 情况 下 , 单 侧 概 率 和 双 侧 概率 
值 对 应 的 1 界 值 。 如 当 v=24、 双 侧 概率 a=0.05 时 , 由 表 中 查 得 mosp,zx=2.064， 此 处 2.064 即 为 
两 侧 尾 部 概率 各 为 0.025 的 1 界 值 。 由 于 1 分 布 的 对 称 性 , 表 中 只 列 出 了 正 值 。 

2. 可 信 区 间 的 计算 计算 可 信和 区间 的 原理 与 o 已 知情 况 完 全 相同 , 仅仅 是 两 侧 概率 的 界 值 
有 些 差 别 。 按 1 分 布 规 律 , 100% x(1 一 a) 的 1 值 在 -tw,, 和 tow,, 之 间 , 即 


一 4 
PCtns<—— <) =1-a (6-11) 
Se 
将 上 式 写成 可 信和 区间 : 
(X-— lav? X+ tovSx) (6-12) 











tun.v 界 值 可 以 由 附 表 2 查 得 。 需 要 注意 : 在 小 样本 情况 下 , 应 用 这 一 公式 的 条 件 是 原始 变量 元 服 
从 正 态 分 布 。 

在 大 样本 情况 下 (如 n>50), 无 论 变量 XX 是 否 服从 正 态 分 布 ,按照 中 心 极限 定理 也 都 服从 
正 态 分 布 , 同时 :分 布 逼近 标准 正 态 分 布 , 可 信 区 间 可 以 用 下 式 近似 计算 : 

(XK -zn +2) (6-13) 

例 6-2 某 医生 测 得 25 名 动脉 粥 样 硬化 患者 血浆 纤维 蛋白 原 含量 的 均 数 为 3.32g/L, 标准 
差 为 0.57g/L, 试 计算 该 种 病人 血浆 纤维 蛋白 原 含量 总 体 均 数 的 95% 可 信 区 间 。 

本 例 m=25, 歹 =3.32,S=0.57,v=n-1=25-1=24,a=0.05, 查 ! 值 表 fosp.za=2.064, 按 公 
式 (6-12 ) 计 算得 : 

下 限 : 斑 -ApvSz=3.32 一 2.064x0.57/V25 =3.08(g/L) 
上 限 : 乏 +&avSr=3.32+2.064x0.57/V25 =3.56(g/L) 

根据 该 资料 计算 得 到 , 动脉 粥 样 硬化 病人 血浆 纤维 蛋白 原 含量 总 体 均 数 的 95% 可 信 区 间 
为 3.08~3.56g/L。 

例 6-3 试 计算 例 6-1 中 该 地 成 年 男子 红细胞 总 体 均 数 的 95% 可 信 区 间 。 

本 例 属于 大 样本 ,可 采用 正 态 近似 的 方法 计算 可 信 区 间 (a=0.05)。 因 为 X=4.77, S=0.38， 
n=140, 则 95% 可 信和 区间 为 

下 限 : 和 -xpSz= 4.77-1.96x0.38/V140 =4.71(x1021L) 

上 限 : 全 +zsSz=4.77+1.96x0.38/V140 =4.83(x 102/L) 

估计 该 地 成 年 男子 红细胞 总 体 均 数 的 95% 可 信 区 间 为 4.71 x 102L~4.83x 10™L。 

3. 单 侧 可 信 区 间 ”前 面 涉 及 的 都 是 双 侧 可 信 区 间 。 但 有 些 情况 下 ,我们 所 关心 的 仅仅 是 
单 侧 的 可 信 限 。 例 如 , 对 轻 度 原 发 性 高 血压 患者 进行 治疗 , 一 般 病 人 接受 治疗 后 可 以 使 舒张 压 
平均 降低 10mmHg, 现 提出 一 种 新 的 治疗 方法 , 我 们 仅 对 此 疗法 是 否 优 于 标准 法 感 兴趣 ， 为 此 有 
100 名 患者 接受 了 这 种 新 疗法 , 得 到 的 数据 显示 舒张 压 平均 降低 12.7mmHg, 血压 治疗 前 后 变化 
的 标准 差 为 5.6mmHg, 能 否 说 新 疗法 优 于 标准 疗法 (a=0.05)? 为 此 可 以 计算 单 侧 可 信 区 间 ,其 
中 只 需 关 心 可 信和 区间 的 下 限 , 即 如 果 下 限 值 高 于 10mmHg, 我 们 就 有 理由 下 结论 说 新 疗法 优 于 
标准 疗法 。 

单 侧 可 信 区 间 与 双 侧 可 信 区 间 的 计算 公式 基本 相同 , 只 需 将 公式 (6-12) 和 (6-13 ) 中 的 抽样 
分 布 的 双 侧 界 值 换 成 单 侧 界 值 , 同时 只 取 下 限 或 上 限 。 本 例 95% 可 信 区 间 下 限 为 


Ylo0s%Sz =12.7—1.66x5.6/ V100 =11.8(mmHg) 
即 有 95% 的 把 握 推断 新 药 平均 降 压 至 少 为 11.8mmHg, 优 于 标准 疗法 。 
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四 、 两 总 体 均 数 差 值 的 区 间 估 计 


实际 中 ,有 时 需要 计算 两 个 总 体 均 数 差 值 的 可 信和 区间 , 例如 通过 计算 两 种 降 压 药物 平均 降 
压 的 差 值 比 较 两 种 药物 的 差别 , 其 双 侧 100(1-x)% 可 信 区 间 的 计算 公式 为 





CK 一 和 2) 士 kavSZE- 志 (6-14) 
其 中 ,v=m+ns 一 2 为 自由 度 , Sz 元 为 两 样本 均 数 之 差 的 标准 误 , 当 两 总 体 方差 相同 时 , 则 
全 二 | 下 1 ,02 DS + DS; (6-15) 
Sr 次 记 小 “ m+n—2 


其 中 82 为 两 样本 的 合并 方差 。 当 两 样本 的 样本 含量 均 较 大 时 (如 1 和 靖 均 大 于 50), 上述 计 算 
可 信 区 间 中 的 i., 可 用 相应 的 zs 代 车 , 而 且 无 论 两 总 体 的 方差 是 否 相同 , 有 
Se 

2 


Sr 
Mi 了 


例 6-4 ”评价 复方 顷 沙 坦 胶囊 与 顷 沙 坦 胶 囊 对 照 治疗 轻 中 度 高 血压 的 有 效 性 ,将 102 名 
患者 随机 分 为 两 组 , 其 中 试验 组 和 对 照 组 分 别 为 54 例 和 48 例 。 经 六 周 治疗 后 测量 收缩 压 ， 
试验 组 平均 下 降 15.77mmHg, 标准 差 为 13.17mmHg; 对 照 组 平均 下 降 9.53mmHg, 标准 差 为 
13.55mmHg。 试 估计 两 组 收缩 压 平均 下 降 差 值 的 95% 可 信 区 间 。 

由 式 (6-15)、 式 (6-16) 计 算 , 得 


(54—Dx13.17?+ (48 一 Dx13.55? 
54+48 一 2 


Sz-_z,=1|178.221x a =2.6483 
54 48 


查 附 表 2 的 1 界 值 表 得 bow om= 1.984, 由 公式 (6-14) 两 组 总 体 均 数 之 差 的 95% 可 信 区 间 为 
下 限 :CX 一 ) 一 tyvSz 元 =(5.77 一 13.17) 一 1.984x2.6483 一 2.65 


wav 


(6-16) 





S2 =178.221 





上 限 : (XX, 一 卫 ,) ++ tavS7 5.77—13.17)+1.984x2.6483= 7.85 
即 两 组 收缩 压 平 均 下 降 差 值 的 95% 可 信 区 间 为 -2.65~7.85mmHg。 


五 、 总 体 率 的 区 间 估 计 

总 体 率 的 点 估计 是 直接 用 样本 率 p 作为 总 体 率 x 的 点 估计 值 , 因 其 未 考虑 抽样 误差 , 在 实 
际 的 医学 研究 中 , 经 常 使 用 总 体 率 的 区 间 估 计 。 

1. 小 样本 率 的 区 间 估计 “利用 二 项 分 布 可 估计 其 总 体 率 1-a 可 信 区 间 , 0 一般 取 0.05。 对 
于 ws50, 且 p 接 近 于 0 或 1 时 ,可 直接 查 附 表 6 百 分 率 的 可 信 区 间 表 得 到 其 总 体 率 的 可 信和 区间。 

例 6-5 2003 年 4-6 月 某 医院 重症 监护 病房 收治 重症 SARS 患者 38 人 , 其 中 死亡 14 人 , 求 
SARS 病死 率 的 95% 可 信和 区间。 

查 附 表 6, 在 n=38,X=14 的 纵横 交叉 处 的 数值 上 行 22~54, 下 行 18~59, 即 SARS 病死 率 
95% 的 可 信 区 间 为 22%~54%。 

注意 : 附 表 6 中 的 XX 只 列 出 X<m2 部 分 , 当 X>n/2 时 ,应 以 4- 立 值 查 表 , 然后 用 100 减 去 
查 表 得 到 的 数值 , 即 为 所 求 的 可 信 区 间 。 

2. 大 样本 率 的 区 间 估计 当 较 大 ,p 和 1-p 均 不 太 小 ,如 功 和 n(1-p) 均 大 于 5 时 ,可 
利用 样本 率 p 近似 服从 正 态 分 布 的 原理 来 估计 总 体 率 的 1-a 可 信 区 间 , 计算 公式 为 

p25, (G17) 
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其 中 5, =Vpd 一 D)/mo 当 a=0.05 时 ， Z00sp=1.96o 

例 6-6 某 区 疾病 预防 控制 中 心 2002 年 对 该 乡镇 250 名 小 学 生 进 行 贫血 的 检测 , 结果 发 现 
有 86 名 贫血 者 , 检 出 率 为 34.40%, 求 贫血 检 出 率 95% 的 可 信和 区 间 。 

本 例 n=250 较 大 , 且 np=86,n(1-p)=164 均 大 于 5, 可 用 (6-17) 公 式 计算 总 体 率 95% 的 
可 信 区 间 。 

Piz,125, = P+Z00s | PITP) -03440+1.96 2 = (0.2851,0.4029) 
n 

即 该 乡镇 小 学 生 贫 血 检 出 率 95% 的 可 信和 区间 为 28.51%~40.29%。 


六 、 两 总 体 率 差 值 的 区 间 估 计 


设 两 样本 率 分 别 为 和 ps, 当 与 加 均 较 大 ,上 且 pi,1-pi 及 ps,1-P: 均 不 太 小 ,如 mpi、 
(1 一 pi)、mps、m(1-ps) 均 大 于 5 时 ,可 采用 正 态 近 似 法 对 两 总 体 率 差 值 进行 可 信 区 间 估 计 ， 
其 计算 公式 为 














(局 一 已) 士 Za29m p, (6-18) | 
其 中 
(6-19) | 
加 和 名 分 别 表示 两 组 中 某 事件 发 生 的 例 数 。 


例 6-7 某 医院 口腔 科 医 生 用 极 固 宁 治疗 牙 本 质 过 敏 症 , 以 双 氮 涂料 作对 照 , 进行 了 1 年 的 
追踪 观察 , 结果 见 表 6-1 所 示 , 试 估计 两 组 有 效率 差别 95% 的 可 信和 区间 。 





表 6-1 治疗 牙 本 质 过 敏 症 两 组 有 效率 的 比较 




















组 别 总 牙 数 有 效 数 有 效率 (% ) 
试验 组 77 61 79.22 
对 照 组 69 38 55.07 
合计 146 99 67.81 
本 例 : 








bt 61+38 
“n+n, 77+69 


| 1 1 
S$, ,= (1 -PP)| 一 + 一 |= = -= |=0.0775 
pi-p? pe-Pe 攻 十 2 jeeatna 0678Dx|[ 广 + 二 | 


两 组 总 体 率 差别 95% 的 可 信 区 间 为 
(Pi— Pp2) 2128, p,=(0.7922—0.5507)+1.96 x 0.0775=(0.0896, 0.3934) 
即 两 组 治疗 效果 的 总 体 有 效率 之 差 的 95% 可 信和 区间 为 8.96%~39.34%。 


=0.6781 








第 二 节 假设 检验 


假设 检验 (hypothesis test) 亦 称 显著 性 检验 (significant test), 是 统计 推断 的 另 一 重要 内 容 , 其 
目的 是 比较 总 体 参 数 之 间 有 无 差别 。 实 际 中 多 数 情况 是 用 样本 数据 去 推断 总 体 , 由 于 存在 生物 | 
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个 体 变 异 和 随机 测量 误差 , 不 能 简单 地 根据 样本 统计 量 数值 的 大 小 直接 比较 总 体 参 数 。 如 在 比 
较 甲 乙 两 种 治疗 高 脂 血 症 药物 疗效 的 试验 中 , 甲乙 两 组 各 为 100 名 患者 , 甲 药 使 血清 甘油 三 酯 
平均 下 降 1.36mmol/L, 乙 药 使 血清 甘油 三 酯 平均 下 降 1.12mmol/L, 这 一 结果 并 不 能 说 明 甲 药 优 
于 乙 药 , 因为 如 果 再 重新 做 一 次 试验 其 结果 可 能 相反 。 假 设 检验 的 基本 思想 是 , 首先 对 所 需要 
比较 的 总 体 提出 一 个 无 差别 的 假设 , 然后 通过 样本 数据 去 推断 是 否 拒绝 这 一 假设 。 其 意义 可 由 
下 面 的 例子 说 明 。 

例 6-8 ”使 用 黑 加 仑 油 软 胶 训 治疗 高 脂 血 症 , 30 名 患者 治疗 前 后 血清 甘油 三 酯 检测 结果 的 
差 值 为 1.38 士 0.76(mmol/L), 问 治疗 后 血清 甘油 三 酯 是 否 有 所 改善 ? 

对 上 面 问题 可 以 作 如 下 考虑 : 如 果 治 疗 前 后 血清 甘油 三 酯 没有 改善 , 则 前 后 变化 差 值 的 总 


| 体 均 数 应 为 pu=0, 但 现在 计算 出 的 样本 差 值 均 数 也 = 1.38, 其 差别 可 能 由 两 种 原因 引起 , 即 药物 


的 作用 和 生物 变异 性 波动 。 现 用 假设 及 :yw=0 表示 治疗 前 后 没有 差别 , 需要 判断 的 是 这 个 假 
设 是 否 符合 实际 检测 结果 。 我 们 知道 , 即使 治疗 前 后 血清 甘油 三 酯 没有 改善 , 由 于 生物 的 变异 
性 ,了 不 会 伦 好 等 于 0; 但 当 了 -0 较 大 时 , 血清 甘油 三 酯 的 改变 就 难以 完全 用 生物 变异 来 解释 ， 
从 而 认为 药物 具有 作用 。 问 题 是 了 - 0 究竟 要 大 到 多 少 才能 够 下 这 样 的 结论 ? 

由 前 一 节 知道 , 如 果 治 疗 前 后 血清 甘油 三 酯 检测 结果 的 差 值 服从 正 态 分 布 ,在 名 :p=0 成 
立 的 条 件 下 ,1=(4 一 0)/(S, /Vn) 服 从 1 分 布 (5; 为 差 值 的 标准 差 )。 因 此 ,可 以 利用 现 有 样本 计算 
:统计 量 , 然后 根据 分布 得 到 能 有 如 此 大 差异 的 概率 进行 判断 , 如 果 这 种 概率 很 小 , 即 计算 出 


的 1 值 超出 了 给 定 的 界限 (检验 水 准 ), 则 倾向 于 拒绝 假设 饭 , 认为 治疗 前 后 有 差别 (参见 图 6-2 )。 





图 6-2 利用 t 分 布 进行 假设 检验 原理 示意 图 


假设 检验 的 实质 是 判断 观察 到 的 “差别 " 是 由 抽样 误差 引起 还 是 总 体 上 的 不 同 , 目的 是 评价 
两 种 不 同 处 理 引起 效应 不 同 的 证 据 有 多 强 , 这 种 证 据 的 强度 用 概率 了 度量 和 表示 。 除 /分 布 外 ， 
针对 不 同 的 资料 还 有 其 他 各 种 检验 统计 量 及 分 布 ,如 分 布 . 必 分 布 等 ,应 用 这 些 分 布 对 不 同类 
型 的 数据 进行 假设 检验 的 步骤 相同 , 其 差别 仅仅 是 需要 计算 的 检验 统计 量 不 同 。 

二 、 基 本 步 又 

(一 ) 建立 假设 和 确定 检验 水 准 

假设 检验 中 ， 包括 原 假设 (null hypothesis ) 和 备 择 假设 (alternative hypothesis ) 两 种 假设 。 

原 假设 符号 为 ty, 指 需要 检验 的 假设 , 如 治疗 前 后 血清 甘油 三 酯 没有 差别 , 即 

ZHU=0 


| 这 一 假设 通常 与 我 们 要 验证 的 结论 相反 , 是 计算 检验 统计 量 和 P 值 的 依据 。 


备 择 假设 符号 为 已 ,是 在 为 成 立 证 据 不 足 的 情况 下 而 被 接受 的 假设 , 如 拒绝 治疗 前 后 血 
清 甘油 三 酯 相同 的 假设 , 可 表示 为 
Hi:ua#0 
备 择 假设 有 双 侧 和 单 侧 两 种 情况 。 双 侧 检 验 指 无 论 是 正方 向 还 是 负 方向 的 误差 , 车 显著 地 超出 
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检验 水 准则 拒绝 包 , 把 :Mu#0 即 为 双 侧 检验 。 单 侧 检验 指 仅 在 正方 向 或 负 方 向 误差 超出 规定 
的 检验 水 准时 则 拒绝 名, 如 治疗 后 血清 甘油 三 酯 下 降 的 假设 可 表示 为 
:Wa>0( 或 可 :ya<0) 

双 侧 检验 和 单 侧 检验 应 如 何 选择 , 需 根 据 研 究 目的 和 专业 知识 而 定 。 例 如 , 比较 两 种 降 血 
脂 药物 的 疗效 , 因 无 法 判断 两 种 药物 的 优 劣 , 应 选用 双 侧 检验 ; 如 果 是 检验 一 种 药物 的 降 血 脂 
作用 , 因为 药物 一 般 总 是 能 降低 血脂 而 不 是 升 高 血脂 , 这 时 可 以 采用 单 侧 检验 。 由 于 双 侧 检验 
将 拒绝 域 的 概率 等 分 在 :分布 两 侧 的 尾部 , 因此 单 侧 检验 的 上 界 值 ( 绝 对 值 ) 总 是 小 于 双 侧 检验 
所 用 的 界 值 。 对 同一 样本 , 双 侧 检验 得 出 有 显著 性 差别 的 结论 , 单 侧 检验 也 一 定 是 显著 的 , 因 
而 在 实际 中 使 用 较 多 的 是 双 侧 检验 。 本 书 中 在 未 作 说 明 的 情况 下 , 选用 的 均 是 双 侧 检验 。 
建立 检验 假设 的 同时 , 还 必须 给 出 检验 水 准 。 检 验 水 准 亦 称 显著 性 水 准 (significant level 
用 a 表示, 是 预先 规定 的 拒绝 域 的 概率 值 , 实际 中 一 般 取 a=0.05 或 a=0.01。 显 然 ,a 值 越 大 越 
容易 得 出 有 差别 的 结论 。 

(二 ) 选择 检验 方法 和 计算 检验 统计 量 

根据 资料 类 型 、 研 究 设计 方案 和 统计 推断 的 目的 , 选择 适当 的 检验 方法 和 计算 公式 。 许 多 
假设 检验 方法 是 以 检验 统计 量 来 命名 的 , 如 :检验 \z 检 验 下 检验 和 刀 检 验 等 , 这些 都 是 后 面 章 
节 要 学 习 的 重要 内 容 。 

(三 ) 根据 P 值 做 出 统计 推断 

查 表 得 到 检验 用 的 临界 值 , 然后 将 算得 的 统计 量 与 拒绝 域 的 临界 值 作 比 较 ,确定 了 值 。 如 
对 双 侧 1 检验 |7|z1w,,, 则 P<a, 按 a 检验 水 准 拒绝 世 ,接受 及 ;车 P>a, 则 不 能 拒绝 所 。P 值 
是 假设 检验 下 结论 的 主要 依据 , 其 含义 是 指 在 原 假设 成 立 的 条 件 下 , 观察 到 的 样本 差别 是 由 于 
机 遇 所 致 的 概率 。 因 此 , P 值 越 小 越 有 理由 拒绝 原 假设 , 认为 总 体 之 间 有 差别 的 统计 学 证 据 越 
充分 。 需 要 注意 : 不 拒绝 所 不 等 于 支持 包 成立, 仅 表示 现 有 样本 信息 不 足以 拒绝 Ho。 

我 们 在 下 结论 时 , 应 使 用 “差异 有 无 统计 学 意义 " 进行 表述 。 由 于 统计 软件 的 应 用 和 普及 ， 
最 好 列 出 精确 的 己 值 , 以 便 对 检验 结果 的 可 靠 性 做 出 准确 的 判断 , 当 软 件 输出 了 为 0.000 时 ,应 
写成 “P<0.001"。 在 没有 统计 软件 的 情况 下 , 也 可 以 通过 查阅 界 值 表 得 到 了 值 的 所 在 范围 。 




















a As- 有 a 
练习 题 
| 
| 一 、 单 项 选择 题 
1. 样本 均 数 的 标准 误 越 小 说 明 (  ) 
A. 观察 个 体 的 变异 越 小 B. 观察 个 体 的 变异 越 大 
C. 抽样 误差 越 大 D， 由 样本 均 数 估计 总 体 均 数 的 可 靠 性 越 小 


| E. 由 样本 均 数 估计 总 体 均 数 的 可 靠 性 越 大 
2. 抽样 误差 产生 的 原因 是 ( ) 


A. 样本 不 是 随机 抽取 B. 测量 不 准确 
C. 资料 不 是 正 态 分 布 D. 个 体 差 异 


E. 统计 指标 选择 不 当 
3. 要 减少 抽样 误差 ,通常 的 做 法 是 ( ) 








A. 减 小 系统 误差 B. 将 个 体 变 异 控制 在 一 定 范围 内 
C. 减 小 标准 差 D. 控制 偏 位 
E. 适当 增加 样本 含量 





EE 
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4. 对 于 正 偏 态 分 布 的 总 体 , 当 样 本 含量 足够 大 时 ,样本 均 数 的 分 布 近似 为 ( ) 
A. 正 偏 态 分 布 B. 负 偏 态 分 布 
C. 正 态 分 布 D. 1 分 布 
E. 标准 正 态 分 布 
5. 用 某 种 中 成 药 治疗 高 血压 患者 100 名 , 总 有 效率 为 80.2%, 标准 误 为 0.038, 则 总 有 效率 
的 95% 可 信 区 间 估 计 为 ( ) 
A. 0.802 土 1.64x0.083 
C. 0.802+2.58 x 0.083 
E. <0.802+1.64x0.083 
6. 根据 样本 资料 算得 健康 成 人 和 白细胞 计数 的 95% 可 信 区 间 为 7.2x10”/L~9.1x10”L, 其 
含义 是 ( ) 
A. 估计 总 体 中 有 95% 的 观察 值 在 此 范围 内 
B. 总 体 均 数 在 该 区 间 的 概率 为 95% 
C. 样本 中 有 95% 的 观察 值 在 此 范围 内 
D. 
E. 


B. 0.802 士 1.96 x 0.083 
D. >0.802 一 1.64x 0.083 


该 区 间 包 含 样本 均 数 的 可 能 性 为 95% 
该 区 间 包 含 总 体 均 数 的 可 能 性 为 95% 
7. 某 地 抽取 正常 成 年 人 200 名 , 测 得 其 血清 胆 固 酵 的 均 数 为 3.64mmol/L, 标准 差 为 
1.20mmolL, 则 该 地 正常 成 年 人 血清 胆固醇 均 数 95% 的 可 信 区 间 是 (。”) 
A. 3.64+1.96 x 1.20 B. 3.64+1.20 
C. 3.64+1.96x1.20/V200 D. 3.64+2.58x 1.20/V200 
E. 3.64 土 2.58x 1.20 
8. 假设 检验 的 目的 是 ( ) 
A. 检验 参数 估计 的 准确 度 B. 检验 样本 统计 量 是 否 不 同 
C. 检验 样本 统计 量 与 总 体 参 数 是 否 不 同 D. 检验 总 体 参 数 是 否 不 同 
E. 检验 样本 的 忆 值 是 否 为 小 概率 
9. 假设 检验 差别 有 统计 学 意义 时 ,PP 越 小 ,说 明 (  ) 
A. 样本 均 数 差别 越 大 
总 体 均 数 差别 越 大 
认为 样本 之 间 有 差别 的 统计 学 证 据 越 充分 
. 认为 总 体 之 间 有 差别 的 统计 学 证 据 越 充分 
认为 总 体 之 间 有 差别 的 统计 学 证 据 越 不 充分 
10. 关于 假设 检验 ,正确 的 说 法 是 ( 。” ) 
A. 检验 水 准 必 须 设 为 0.05 


HODOm 


B. 必须 采用 双 侧 检验 


C. 必须 根据 样本 大 小 选择 检验 水 准 D. 必须 建立 无 效 假 设 
E. 要 说 明 无 效 假设 正确 , 必须 计算 P 值 
二 、 计 算 与 分 析 


1. 为 了 解 某 地 区 小 学 生 血 红 有 蛋白 含量 的 平均 水 平 ， 现 随机 抽取 该 地 小 学 生 450 人 , 算 
得 其 血红 蛋白 平均 数 为 101.4g/L, 标准 差 为 1.5g/L, 试 计算 该 地 小 学 生 血 红 蛋 白 平均 数 的 
95% 可 信 区 间 。 

2. 新 药 临床 试验 对 加 苦 沙 星 冻 干粉 针 治疗 细菌 感染 进行 随机 对 照 研究 , 采用 左 氧 气 
沙 星 作为 对 照 组 ,试验 组 和 对 照 组 的 例 数 分 别 为 102 和 104 例 , 试验 结果 加 替 沙 星 冻 干粉 
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针 的 有 效率 为 94.4%, 左 氧 气 沙 星 的 有 效率 为 91.26%, 试 计算 两 组 有 效率 差 值 的 95% 可 信 
区 间 。 

3. 研究 高 胆固醇 是 否 有 家 庭 聚 集 性 , 已 知 正常 儿童 的 总 胆固醇 平均 水 平 是 175mg/dl， 
现 测 得 100 名 曾 患 心脏 病 且 胆 固 醇 高 的 子 代 儿童 的 胆固醇 平均 水 平 为 207.5mg/dl, 标准 差 
为 30mg/dl。 问 题 : 

(1) 如 何 衡量 这 100 名 儿童 总 胆固醇 样本 平均 数 的 抽样 误差 ? 

(2) 估计 100 名 儿童 的 胆固醇 平均 水 平 的 95% 可 信 区 间 。 

(3 ) 根据 可 信 区 间 判 断 高 胆固醇 是 否 有 家 庭 聚集 性 , 并 说 明理 由 。 











笔记 
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本 章 介绍 计量 资料 两 组 均 数 比较 的 + 检验 方法 , 根据 研究 设计 和 资料 的 性 质 有 单个 样本 / 
检验 、 配 对 样本 ! 检验 、 两 个 独立 样本 ! 检验 以 及 在 方差 不 齐 时 的 检验 。: 检验 的 理论 依据 是 
上 一 章 介绍 的 1 分 布 和 假设 检验 原理 。 


第 一 节 1 检 验 


一 、 单 样本 1 检验 


单 样本 检验 (one-sample ttest) 又 称 单 样本 均 数 :检验 ， 适用 于 样本 均 数 了 与 已 知 总 体 均 
数 jw 的 比较 ,其 比较 目的 是 检验 样本 均 数 卫 所 代表 的 总 体 均 数 4 是否 与 已 知 总 体 均 数 po 有 差 
别 。 已 知 总 体 均 数 p, 一 般 为 标准 值 理论 值 或 经 大 量 观察 得 到 的 较 稳 定 的 指标 值 。 

单 样本 检验 用 于 总 体 标准 差 未 知 的 资料 , 其 统计 量 : 值 按 公 式 (7-1) 计 算 1: 

X-H _ 反 一 和 


卫 : 
Sz S/n 








| (7-1) 





其 中 5 为 样本 标准 差 ,n 为 样本 含量 。 

例 7-1 以往 通 过 大 规模 调查 已 知 某 地 新 生 儿 平均 出 生体 重 为 3.30kg。 从 该 地 难产 儿 中 随 
机 抽取 35 名 新 生 儿 作为 研究 样本 , 平均 出 生体 重 为 3.42kg, 标准 差 为 0.40kg, 问 该 地 难产 儿 出 
生体 重 与 一 般 新 生 儿 体重 有 无 差异 ? Ee 

本 例 已 知 总 体 均 数 jw=3.30kg, 但 总 体 标准 差 o 未 知 ,n=35, 为 小 样本 ,X=3.42kg, S=0.40kg， 
故 选用 单 样本 检验。 

(1) 建立 检验 假设 , 确定 检验 水 准 

Hh: 4=pw, 该 地 难产 儿 与 一 般 新 生 儿 平均 出 生体 重 相同 

:hz#po, 该 地 难产 儿 与 一 般 新 生 儿 平均 出 生体 重 不 同 

a=0.05 

(2) 计算 检验 统计 量 

在 = 成 立 的 前 提 条 件 下 , 计算 统计 量 为 

_ 一 _X-Wo _3.42-3.30 _1.77 
Sz  S/Vn 0.40/V35 

(3) 根 据 P 值 ,作出 推断 结论 

本 例 自由 度 v=n 一 1=35 一 1 =34, 查 附 表 2, 得 mosz.a=2.032。 因为 1<too0sw,34, 故 P>0.05， 
表明 差异 无 统计 学 意义 , 按 a=0.05 水 准 不 拒绝 包 , 即 根据 现 有 样本 信息 , 尚 不 能 认为 该 地 难产 
儿 与 一 般 新 生 儿 平均 出 生体 重 存在 差异 。 


-、 配 对 样本 均 数 1 检验 
配对 样本 均 数 /检验 简称 配对 :检验 (paired rtest), 又 称 非 独立 两 样本 均 数 /检验 ,适用 于 配 























差别 。 配 对 设计 (paired design ) 是 将 受 试 对 象 按 某 些 重要 特征 相近 的 原则 配 成 对 子 , 每 对 中 的 
60 
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两 个 个 体 随 机 地 给 予 两 种 处 理 。 应 用 配对 设计 可 以 减少 实验 误差 和 控制 非 处 理 因素 , 提高 统计 
处 理 效率 。 配 对 设计 有 两 种 情况 : @ 同 源 配对 : 同一 受 试 对 象 或 同一 标本 的 两 个 部 分 , 随机 分 
配 接受 两 种 不 同 处 理 ; @ 异 源 配对 : 为 消除 混杂 因素 的 影响 ,将 两 个 同 质 受 试 对 象 配对 分 别 接 
受 两 种 处 理 , 如 把 同 窝 、 同 性 别 和 体重 相近 的 动物 配 成 一 对 , 或 把 同性 别 、 年 龄 相近 及 病情 相同 
的 病人 配 成 一 对 。 

配对 设计 的 资料 具有 对 子 内 数据 一 一 对 应 的 特征 , 研究 者 应 关心 对 子 的 效应 差 值 而 不 是 
各 自 的 效应 值 。 因 此 进行 配对 :检验 时 ,首选 应 计算 各 对 数据 间 的 差 值 4, 将 4 作为 变量 计算 均 
数 。 配 对 样本 1 检验 的 基本 原理 是 假设 两 种 处 理 的 效应 相同 , 理论 上 差 值 4 的 总 体 均 数 jw 为 0， 
现 有 样本 差 值 均 数 不 等 于 0 的 也 可 以 来 自如 =0 的 总 体 , 也 可 以 来 自如 0 的 总 体 。 因 此 可 将 该 
检验 理解 为 差 值 样本 均 数 4 与 已 知 总 体 均 数 w= 0 比较 的 单 样本 ! 检 验 , 其 检验 统计 量 为 


(72 





式 中 4 为 每 对 数据 的 差 值 , 4 为 差 值 样本 的 均 数 , S, 为 差 值 样本 的 标准 差 , 5; 为 差 值 样本 均 数 的 
标准 差 , 即 差 值 样本 的 标准 误 ,n 为 配对 样本 的 对 子 数 。 


例 7-2” 某 项 研究 评估 咖啡 因 对 运动 者 的 心肌 血 流量 的 影响 , 先后 测定 了 12 名 男性 志愿 者 





饮用 咖啡 前 后 运动 状态 下 的 心肌 血 流量 [ ml/(min*g)], 数据 如 表 7-1 所 示 , 问 饮用 咖啡 前 后 运动 
者 的 心肌 血 流量 有 无 差异 。 


表 7-1 12 名 运动 者 饮用 咖啡 前 后 的 心肌 血 流量 [ my( min*g )] 














编号 饮用 前 饮用 后 差 值 dq dq? 
1 4.8 4.8 0 0 
2 5.1 4.9 0.2 0.04 
3 6.4 4.5 1.9 3.61 
4 5 5.4 0.3 0.09 
革 5.6 4.7 0.9 0.81 
6 5 3.8 1.5 2.25 
7 sl 4.1 1.0 1.00 
8 4.9 3.2 1.7 2.89 
9 4.7 3.0 1 2.89 
10 3.5 3.2 0.3 0.09 
11 $2 5.3 -0.1 0.01 
12 5.3 5.1 0.2 0.04 

合计 9.6(5a) 13.72(2,4°) 





(1) 建立 检验 假设 ,确定 检验 水 准 

印 : j=0, 饮用 咖啡 前 后 运动 者 的 平均 心肌 血 流量 差异 为 零 
本 :ya#0, 饮用 咖啡 前 后 运动 者 的 平均 心肌 血 流量 差异 不 为 零 
a=0.05 

(2) 计算 检验 统计 量 

先 计算 差 值 4 及 qd?, 如 表 7-1 第 四 、 五 列 所 示 。 经 计算 : 


D4d=9.6, 3d =13.72,4 = (D4q)/n=9.6/12=0.8 











:2 
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a) 2 
Ee 9) 0 
5, 2 -= 12 -=0.741 
7 一 1 12=1 
计算 差 值 的 标准 误 : 
SOimal 
5 地 =- -0214 
按 式 (7-2) 计 算 , 得 : 
-24_ 08 -3738 
S 0.214 
〈3) 根据 已 值 作出 推断 结论 


自由 度 v=7-1=12-1=11, 查 附 表 2, 得 :mon=2.201 
本 例 +> nop ii, P<0.05, 差别 有 统计 学 意义 , 拒绝 所 ,接受 友 , 可 以 认为 饮用 咖啡 前 后 运 
动 者 的 心肌 血 流量 存在 差异 。 


三 、 两 独立 样本 均 数 1 检验 


两 独立 样本 1 检验 (two-sample t-test), 又 称 成 组 1 检 验 , 它 适用 于 完全 随机 设计 的 两 样本 均 
数 的 比较 , 其 目的 是 检验 两 样本 所 来 自 总 体 的 均 数 是 否 相等 。 完 全 随机 设计 是 将 受 试 对 象 随机 
地 分 配 到 两 组 中 , 每 组 对 象 分 别 接受 不 同 的 处 理 , 分 析 比较 两 组 的 处 理 效应 。 

两 独立 样本 ! 检验 要 求 两 样本 所 代表 的 总 体 服从 正 态 分 布 WU , ci2) 和 N(ua, oz ), 且 两 总 
体 方差 me=o， 即 方差 齐 性 (homogeneity of variance )。 若 两 者 总 体 方 差 不 齐 ， 可 采用 t+ 检验 、 变 
量变 换 或 用 秩 和 检验 方法 处 理 。 

两 独立 样本 1 检验 的 检验 假设 是 两 总 体 均 数 相等 , 即 加: y=1, 也 可 以 表述 为 1 一 Ks=0， 
这 里 可 将 两 样本 均 数 的 差 值 五 -五 .看 成 一 个 统计 量 , Si 就 是 差 值 的 标准 误 , 则 在 FH 条件 下 
两 独立 样本 均 数 1 检验 可 视 为 样本 瑟瑟 与 已 知 总 体 均 数 p 一 ja=0 比较 的 单 样本 1 检验 ,统计 
量 计算 公式 为 











_ | 名 -无 |-0 | 名 -元 | 








1 = (7-3) 

na ,V=Nn1+h2—2 

其 中 
ji 

a ee 

2 ba 2 

0 

B= 1 2 (7-5) 





c 


列 溃 坝 二 人 
52 称 为 合并 方差 ( pooled variance ), 公式 (7-5 ) 可 用 于 已 知 两 样本 观察 值 原始 资料 时 计算 , 当 两 
样本 标准 关 S, 和 8 已 知 时 , 合并 方差 982 为 
(一 DS2+ Cn, — LS 
两 于 和英 一 过 

例 7-3 某 项 研究 评估 低 氧 环境 (模拟 高 原 环境 ) 对 运动 者 心肌 血 流量 的 影响 , 将 17 名 男性 
志愿 者 随机 分 成 两 组 , 分 别 在 正常 含 氧 环境 (正常 组 ) 和 低 氧 环境 ( 低 氧 组 ) 中 测定 运动 后 的 心 
肌 血 流量 [ my(min*g)], 数据 如 表 7-2 所 示 , 问 两 种 环境 中 运动 者 的 心肌 血 流量 有 无 差异 。 


内 后 


(7-6) 
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表 7-2 17 名 运动 者 的 心肌 血 流量 [ ml/( min*g)] 
正常 组 心肌 血 流量 ( X; ) ” 低 氧 组 心肌 血 流量 (X) | 正常 组 心肌 血 流量 ( X; ) ” 低 氧 组 心肌 血 流量 (X;) 





和 有 6.4 3 4.9 
3 53:7 .3 4.7 
231 5.6 22 EA 
2.7 5.3 2.2 

2 | 





(1) 建立 检验 假设 ,确定 检验 水 准 
y: 441=p0, 两 种 环境 中 运动 者 的 心肌 血 流量 的 总 体 均 数 相同 
后 : pz#j2, 两 种 环境 中 运动 者 的 心肌 血 流量 的 总 体 均 数 不 同 
a=0.05 
(2) 计算 检验 统计 量 
由 原始 数据 计算 得 : 
m=9, >, X=23.9, DX?=65.27, ¥ =2.656 
m=8, DX,=41.2, DX? =217.26, ,=5.150 


代入 公式 (7-5 ) 和 (7-4), 得: 





按 式 (7-3 ) 计 算 , 得 
ng |2.656—5.150| 


=7.581 
0.329 


(3) 根 据 P 值 ,作出 推断 结论 

两 独立 样本 1 检验 自由 度 为 v=n1+n,-2=9+8 一 2=15; 查 1 界 值 表 , mows=2.131。 由 于 
1> toosp.1s， P<0.05, 按 a=0.05 的 水 准 拒绝 本 ,, 接受 已 ,两 组 差异 有 统计 学 意义 , 可 以 认为 两 种 
环境 中 运动 者 的 心肌 血 流量 存在 差异 。 

有 些 资料 (如 抗体 滴 度 的 资料 ), 宜 用 几何 均 数 表示 其 平均 水 平 。 由 于 这 些 资料 不 服从 正 态 
分 布 (常服 从 对 数 正 态 分 布 ), 两 样本 的 总 体 方差 也 可 能 不 等 , 当 进 行 几何 均 数 的 假设 检验 时 ， 
应 先进 行 变 量 的 对 数 变 换 , 即将 这 些 观 察 值 * 用 lgX 来 代替 ,lgX 往 往 近 似 服 从 正 态 分 布 , 相应 
的 两 总 体 方差 也 可 能 相等 , 故 可 用 前 述 的 三 种 形式 的 1 检验 对 lg 了 进行 分 析 。 


二 节 方差 不 齐 时 两 样本 均 数 的 + 检验 


当 两 总 体 方差 不 等 (方差 不 齐 ) 时 ,两 独 立 样本 均 数 的 比较 , 可 采用 7 检验, 亦 称 近似 ! 检 验 


(separate variance estimation t-test )。 





一 、 方 差 齐 性 检验 


由 两 样本 方差 推断 两 总 体 方差 是 否 相同 的 检验 方法 可 用 检 验 。F 检 验 要 求 资料 服从 正 态 
分 布 。 检 验 统计 量 下 值 按 式 (7-7) 计 算 ,得 : 
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| _ 5S”( 较 大 ) 
| ”5.7( 较 小 ) 
| 式 中 8? 为 较 大 的 样本 方差 , 52 为 较 小 的 样本 方差 。 检 验 统计 量 下 值 为 两 个 样本 方差 之 比 , 若 样 
| 本 方差 的 不 同 仅 为 抽样 误差 的 影响 , 严 值 一 般 不 会 偏离 1 太 远 。 求 得 严 值 后 , 查 附 表 3( 方 差 齐 
| 性 检验 用 的 下 界 值 表 ) 得 P 值 。 一般 取 a=0.10 或 a=0.05 水 准 作 判 断 ,车 Fz=Fop.6v.ww, 则 P<a， 
| 拒绝 所 ,接受 所 ,可 认为 两 总 体 方差 不 齐 ; 反之 , 则 认为 两 总 体 方差 具有 齐 性 。 

| 例 7-4 ”两 组 小 白鼠 分 别 饲 以 高 蛋白 和 低 蛋 白 饲料 ,4 周 后 记录 小 白鼠 体重 增加 量 (g) 如 表 
| 7-3 所 示 , 问 两 组 动物 体重 增加 量 的 均 数 是 否 相 等 ? 








; 们 三 11 一 1 一 122 一 1 (7-7) 








表 7-3 ”两 种 饲料 喂养 小 白鼠 4 周 后 体重 增 重 ( g ) 情 况 
高 蛋白 组 体重 增加 量 低 蛋 白 组 体重 增加 量 高 蛋白 组 体重 增加 量 低 蛋 白 组 体重 增加 量 
(党 ) (Xe) (xX) (7%) 
| 50 36 48 35 
| 47 38 | 51 33 
42 gn 42 37 
43 38 50 39 
39 36 43 34 
51 39 36 
| 43 S 37 | 














(1) 建立 检验 假设 , 确定 检验 水 准 
邱 : 07= o3, 即 高 蛋白 与 低 蛋白 饲料 喂养 后 小 白鼠 体重 增加 量 的 总 体 方差 相同 
成 : 叶 关 a3, 即 高 蛋白 与 低 蛋白 饲料 眼 养 后 小 白鼠 体重 增加 量 的 总 体 方差 不 同 





| a=0.05 
| (2) 计算 检验 统计 量 
对 表 7-3 的 数据 计算 可 得 82= 17.659, S2 = 3.269, 按 式 (7-7) 计 算 , 得 
2 
- 昱 - T6059 -0 
S2 3.269 


(3) 根 据 P 值 ,作出 推断 结论 
自由 度 w=12-1=11 ,=13 一 1=12, 查 方差 齐 性 检验 用 的 F 界 值 表 ( 附 表 3), Foosp,a1. 1 全 
| 3.34， F> Foosn.n, 12), 故 己 <0.05, 差别 有 统计 学 意义 , 按 a=0.05 水 准 ， 拒绝 印 ， 接受 所。 故 认为 
两 组 体重 增加 量 的 总 体 方差 不 齐 , 不 可 直接 用 两 独立 样本 均 数 1 检验 , 而 应 采用 下 述 的 + 检验 。 
.1 检验 

?检验 有 三 种 方法 ,包括 Satterthwaite 法 近似 1 检验 、Welch 法 近似 1 检验 和 Cochran & Cox 
法 近似 :检验 。Cochran & Cox 法 是 对 临界 值 校正 , Satterthwaite 法 和 Welch 法 是 对 自由 度 进行 校 
正 。 这 里 主要 介绍 Satterthwaite 法 和 Cochran & Cox 法 。z 统计 量 的 计算 公式 为 
已 tie XX 
至 划 (7-8) 
SL 


Mm 用 





a 





Cochran & Cox 法 校正 临界 值 1, 为 


3 和 和 av 十 9 多 tian 
学 证 tan rio Vnitn2 {7:9) 
笔记 计 +S 生 
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式 中 v=n 一 1, w= 一 1, 根 据 校正 的 临界 值 ,做 出 推断 结论 。 
Satterthwaite 法 7 检验 的 自由 度 校正 公式 为 
(S? /nn +52 /n,) 





m-—l m—l 


根据 自由 度 查 : 界 值 表 , 做 出 推断 结论 。Satterthwaite 法 是 目前 统计 软件 中 使 用 最 多 的 + 检验 


方法 。 
例 7-5 对 例 7-4 资 料 进行 2 检验 , 比较 两 组 小 白鼠 增 重 均 数 是 否 不 同 。 
(1) 建立 检验 假设 ,确定 检验 水 准 
Ho: 411=p0， 即 两 种 饲料 小 白鼠 增 重 总 体 均 数 相同 
忌 :M/ 即 两 种 饲料 小 白鼠 增 重 总 体 均 数 不 相同 
a=0.05 
(2) 计算 检验 统计 量 
两 总 体 方差 不 同 , 应 选用 7 检验 。 即 


1 -X45.750-36.538 _ 


Bs Es 3260 
ET 


3.103 











Mm nm 
(3) 根 据 P 值 ,作出 推断 结论 
按 Satterthwaite 法 计算 校正 自由 度 , 得 


2 2 2 2 2 
ee i A 本 689 /12+3.269 /13) -=11.696=12 
CS /m) (392 /nm) (17.659 /12) (3.2692 /13) 
| 详 二 1 12-—1 13—1 
查 上 界 值 表 , i005,12=2.179, 1> too0sn.13, P<0.05。 
按 Cochran & Cox 法 计算 校正 界 值 , 先 查 界 值 表 , 得 toosn,11=2.201, to0sn, 12= 2.179, 再 按 


式 (7-9), 算得 














> 














SE tat SE laws _ 1.472x 2.201+ 0.251x2.179 
SS 1.472+ 0.251 


7 
1 oo05/2 二 





=2.198 


4>toosn, 得 P<0.05。 
两 种 检验 方法 所 获得 的 界 值 虽 略 有 差异 , 但 结论 是 一 致 的 。 按 a=0.05 水 准 , 拒绝 印 , 接受 


本 ,差异 有 统计 学 意义 ,可 认为 两 种 饲料 饲养 后 小 白鼠 增 重 的 总 体 均 数 不 同 , 即 高 蛋白 组 的 体 ， 


重 增加 量 高 于 低 蛋 白 组 。 


第 三 节 “检验 中 的 注意 事项 


1. 假设 检验 结论 正确 的 前 提 ” 作 候 设 检验 用 的 样本 资料 , 必须 能 代表 相应 的 总 体 ,同时 各 
对 比 组 具有 良好 的 组 间 均 衡 性 , 才能 得 出 有 意义 的 统计 结论 和 有 价值 的 专业 结论 。 为 此 要 求 有 
严密 的 实验 设计 和 抽样 设计 , 如 样本 是 从 同 质 总 体 中 抽取 的 一 个 随机 样本 、 试 验 单位 在 干预 前 
随机 分 组 等。 

2. 检验 方法 的 选用 及 其 适用 条 件 “应 根据 分 析 目 的 、 研 究 设计 、 资 料 类 型 、 样 本 量 大 小 等 
选用 适当 的 检验 方法 。! 检验 以 正 态 分 布 和 方差 相同 为 基础 ,资料 是 否 满足 条 件 可 用 正 态 性 检 
验 和 方差 齐 性 检验 的 方法 ,或 直观 地 通过 数据 分 布 进行 判断 。 车 资料 不 符合 上 述 条 件 , 可 以 
使 用 检验 , 也 可 以 进行 数据 变换 或 选用 第 十 章 的 非 参 数 检验 方法 。 在 大 样本 情况 下 (如 1， 





(CS /m) 上 (S2 /7 (7-10) 
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n> 50), 无 论 数 据 是 否 满足 “ 正 态 ”和 “方差 齐 性 ”, 两 组 均 数 检验 也 可 以 采用 z 检 验方 法 , 即 
a 六 2 Es 总 及 

5 

n 


z (7-11) 


1 nm 


3. 双 侧 检验 与 单 侧 检验 的 选择 ” 需 根据 研究 目的 和 专业 知识 予以 选择 。 通 常情 况 下 , 因 
为 无 法 事先 从 专业 上 判断 是 否 一 定 有 p=yo( 或 <p), 因此 更 多 采用 双 侧 检验 。 单 侧 检验 通常 
根据 研究 目的 决定 , 如 果 在 决策 时 只 与 检验 的 一 侧 结果 有 关 ( 如 非 劣 效 性 研究 ), 则 可 以 采用 单 
侧 检验 。 单 侧 检验 和 双 侧 检验 中 的 : 值 计算 过 程 相同 , 只 是 : 界 值 不 同 , 在 相同 检验 水 准 下 (如 
a=0.05), 对 同一 资料 作 单 侧 检验 更 容易 获得 显著 的 结果 。 单 双 侧 检验 的 选择 , 应 在 统计 分 析 工 
作 开始 之 前 根据 专业 知识 决定 , 若 缺乏 这 方面 的 依据 , 一 般 应 选用 双 侧 检验 。 

4. 假设 检验 的 结论 不 能 绝对 化 ”假设 检验 统计 结论 的 正确 性 是 以 概率 作 保证 的 , 作 统 
计 结论 时 不 能 绝对 化 。 在 报告 结论 时 , 最 好 列 出 概率 P 的 确切 数值 , 当 己 值 很 小 时 , 可 以 用 
P<0.0001 表示 ; 同时 应 注 明 采用 的 是 单 侧 检验 还 是 双 侧 检验 , 以 便 读者 与 同类 研究 进行 比较 。 

5. 正确 理解 P 值 的 统计 意义 尸 值 的 意思 指 在 原 假设 成 立 的 条 件 下 , 观察 到 的 试验 差别 
是 由 于 机 遇 所 致 的 概率 。 因 此 , P 值 越 小 越 有 理由 拒绝 原 假设 , 认为 不 同 组 之 间 有 差别 的 统计 
学 证 据 越 充分 。 因 此 , P<a 只 能 说 明 差异 具有 统计 学 意义 ,并 不 代表 实际 差异 的 大 小 。 从 本 章 
t 检 验 的 计算 公式 可 以 看 出 ,假设 检验 的 结论 与 样本 大 小 有 关 , 当 样 本 量 足 够 大 时 , 标准 误 趋 于 
零 , 无 论 两 样本 均 数 相差 多 少 , 都 能 得 到 拒绝 思 的 : 值 和 P 值 。 

6. 假设 检验 和 可 信 区 间 的 关系 ”假设 检验 用 于 推断 总 体 均 数 间 是 否 不 同 , 而 可 信 区 间 则 
用 于 估计 总 体 均 数 所 在 的 范围 , 计算 时 都 利用 了 抽样 误差 估计 公式 。 假 设 检验 能 够 说 明 组 间 是 
否 具有 差别 , 而 可 信 区 间 则 能 够 说 明 差别 有 多 大 , 帮助 判断 结果 是 否 具有 实际 意义 , 因此 在 医 
学 研究 论文 中 通常 都 要 求 提供 可 信 区 间 。 








第 四 节 ”假设 检验 中 两 类 错误 


假设 检验 无 论 是 拒绝 有 还 是 不 拒绝 所 ,都 可 能 犯错 误 , 见 表 7-4。 
表 7-4 ”假设 检验 的 两 类 错误 








假设 检验 结论 
真实 情 》 
拒绝 H。 不 拒绝 Ho 
本 成 立 I 类 错误 (a) 推断 正确 (1 一 a) 
到 成 立 推断 正确 (1-) I 类 错误 (8) 





当 玉 为 真 时 , 假设 检验 结论 拒绝 所 , 接受 本 ,这 类 错误 称 为 1 类 错误 (type Terror), 在 医学 
中 亦 称 假 阳性 错误 。 检 验 水 准 a 是 预先 规定 的 允许 犯 1 类 错误 的 概率 , 当 x=0.05 时 , 表示 在 太 
为 真 的 条 件 下 重复 100 次 试验 , 理论 上 会 有 5 次 拒绝 印 。 

当真 实情 况 为 及 不 成 立时 , 假设 检验 结论 不 拒绝 成 , 这 类 错误 称 为 了 [类 错误 (typell error)， 
在 医学 中 亦 称 假 阴 性 错误 。 其 概率 大 小 用 5 表示 。B 只 取 单 侧 , 其 值 的 大 小 一 般 未 知 , 对 于 计 
量 资料 必须 在 知道 两 总 体 的 标准 差 、 均 数 的 实际 差 值 和 样本 含量 时 才能 算出 。 

为 了 更 好 地 理解 两 类 错误 的 意义 , 以 样本 均 数 与 总 体 均 数 比较 的 单 侧 1 检验 来 说 明 , 见 图 
| 7-1。 设 扬 :4=po, 本 :1>pw; 车厂 实 际 上 成 立 ,但 由 于 抽样 误 差 的 存在 ,偶然 得 到 较 大 的 也 值 ， 
使 得 zi,,,, 按 a=0.05 的 检验 水 准 拒绝 所 , 接受 及, 结论 为 4>ywo, 此 时 犯 1 类 错误 最 大 可 能 概 
率 值 为 a。 相 反 , 若 j 确 实 大 于 jo, (i 不成立), 但 由 于 偶然 性 得 到 较 小 的 X, 值 , 使 得 1<4.,, 检 
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验 结论 不 拒绝 包 , 此 时 犯 的 是 了 [类 错误 , 其 概率 为 8。 统 计 学 上 把 1-P 称 为 检验 效能 (power of a 
test), 也 称 把 握 度 , 表示 当 两 总 体 确实 有 差别 时 , 按 规定 的 检验 水 准 能 发 现 其 差别 的 能 力 。 由 图 
7-1 中 可 见 , 给 定 的 检验 水 准 a 值 越 小 , 出 现 [ 类 错误 的 概率 8 越 大 ,反之 亦 然 。 若 要 同时 减 小 a 


和 Pp, 可 以 通过 增加 样本 量 的 方法 实现 。 











练习 题 


一 、 单 项 选择 题 
1. 两 样本 均 数 之 差 的 标准 误 反 映 的 是 ( ) 
A. 两 样本 数据 集中 趋势 的 差别 B. 两 样本 数据 的 变异 程度 
C. 1 分 布 的 不 同形 状 D. 数据 的 分 布 特征 
E. 两 样本 均 数 之 差 的 变异 程度 
. 两 样本 均 数 比较 ,检验 结果 已 >0.05 说 明 ( ) 
A. 两 总 体 均 数 的 差别 较 小 
C. 支持 两 总 体 无 差别 的 结论 
E. 可 以 确认 两 总 体 无 差别 
3. 由 两 样本 均 数 的 差别 推断 两 总 体 均 数 的 差别 ,其 差别 有 统计 学 意义 指 的 是 (。 ) 
A. 两 样本 均 数 的 差别 具有 实际 意义 
B. 两 总 体 均 数 的 差别 具有 实际 意义 
C. 两 样本 和 两 总 体 均 数 的 差别 都 具有 实际 意义 
D. 有 理由 认为 两 样本 均 数 有 差别 
E. 有 理由 认为 两 总 体 均 数 有 差别 
4. 两 样本 均 数 比较 ,差别 有 统计 学 意义 时 , 尸 值 越 小 说 明 ( 。 ) 


iD 


B. 两 总 体 均 数 的 差别 较 大 
D. 不 支持 两 总 体 有 差别 的 结论 





A. 两 样本 均 数 差别 越 大 B. 两 总 体 均 数 差 别 越 大 
C. 越 有 理由 认为 两 样本 均 数 不 同 D. 越 有 理由 认为 两 总 体 均 数 不 同 


E. 越 有 理由 认为 两 样本 均 数 相同 
. 假设 检验 中 的 正 类 错误 指 的 是 ( ) 
A. 可 能 出 现 的 误 判 错误 


LI 


B. 可 能 出 现 的 假 阳 性 错误 











笔记 


如 
CC 


sh 





已 
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D. 可 能 出 现 的 原 假 设 错误 


人 上 现 的 假 阴 性 错误 


现 的 备 择 假设 错误 
6. et he hm 错误 ,应 该 使 用 的 方法 是 (。” ) 
A. 减 小 工 类 错误 B. 减 小 测量 的 系统 误差 


C. 减 小 测量 的 随机 误差 

E. 增加 样本 量 
7. 以 下 不 能 用 配对 上 检验 方法 的 是 ( ) 

A. 比较 15 名 肝癌 患者 癌 组 织 和 癌 旁 组 织 中 Sir1] 基因 的 表达 量 

B. 比较 两 种 检测 方法 测量 15 名 肝癌 患者 癌 组 织 中 Sirt] 基因 的 表达 量 
C. 比较 早期 和 晚期 肝癌 患者 各 15 例 癌 组 织 中 Sirt] 基因 的 表达 量 
D 
E 


D. 提高 检验 界 值 


. 比较 糖尿 病 患 者 经 某 种 药物 治疗 前 后 糖化 血红 蛋白 的 变化 

. 比较 15 名 受 试 者 针 刺 檀 中 穴 前 后 的 痛 阔 值 

8. 两 独立 样本 均 数 1 检 验 ,其 前 提要 求 是 (。 ) 
A. 两 总 体 均 数 相等 
C. 两 总 体 方 差 相 等 
E. 两 总 体 均 数 和 方差 都 相等 

9. 车 将 配对 设计 的 数据 进行 两 独立 样本 均 数 1 检验 ,容易 出 现 的 问题 是 (。 ) 
A. 增加 出 现 I 类 错误 的 概率 B. 增加 出 现 开 错 误 的 概率 
C. 检验 结果 的 已 值 不 准 D. 方差 齐 性 检验 的 结果 不 准 
E. 不 满足 1 检验 的 应 用 条 件 

10. 两 组 定量 资料 比较 , 当 方 差 不 齐 时 , 应 该 使 用 的 检验 方法 是 (。 ) 


B. 两 总 体 均 数 不 等 
D. 两 总 体 方 差 不 等 


A. 配对 1 检验 B. Satterthwaite 1 检验 
C. 两 独立 样本 均 数 1 检验 D. 方差 齐 性 检验 
E. z 检 验 

二 、 计 算 与 分 析 


1. 已 知 正常 成 年 男子 血红 蛋白 均值 为 140g/L, 今 随机 调查 菜 厂 成 年 男子 30 人 , 测 其 
血红 蛋白 均值 为 125g/L, 标准 差 15g/L。 问 该 厂 成 年 男子 血红 蛋白 均值 与 一 般 成 年 男子 是 
否 不 同 ? 

2. 某 研 究 者 为 比较 耳垂 血 和 手指 血 的 白细胞 数 ,调查 12 名 成 年 人 , 同时 采取 耳垂 血 
和 手指 血 见 下 表 , 试 比较 两 者 的 白细胞 数 有 无 不 同 。 


成 人 耳垂 血 和 手指 血 白细胞 数 (x 10g 儿 ) 








编号 耳 秋 血 手指 血 编号 耳垂 血 手指 血 
1 9.7 6.7 7 4.7 4.6 
2 6.2 5.4 8 5.8 4.2 
3 7.0 5.7 9 7.8 NS 
4 5.3 50 10 8.6 7.0 
5 8.1 7? 11 6.1 53 
6 9.9 8.3 12 9.9 10.3 











3. 分 别 测 得 15 名 健康 人 和 13 名 弄 度 肺 气 肿 病 人 疾 中 0 抗 胰 蛋白 酶 含量 (g/L) 如 下 
表 , 问 健康 人 与 看 度 肺 气 肿 病 人 w 抗 胰 蛋白 酶 含量 是 否 不 同 ? 
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健康 人 与 硬度 肺 气 肿 患者 a 抗 胰 蛋 白 酶 含量 ( g/L ) 














健康 人 硬度 肺 气 肿 患者 健康 人 亚 度 肺 气 肿 患 者 

5 3.6 1.9 4.8 

2 3.4 a 5.6 

4.1 3 13 4.1 

4.3 5.4 1.7 33 

2.6 3.6 1.3 4.3 

1.9 6.8 13 

1 4.7 1.9 

0.6 2.9 








4， 将 钩 端 螺旋 体 病人 的 血清 分 别 用 标准 株 和 水 生 株 作 凝 溶 试验 , 测 得 稀释 倍 效 如 下 
表 , 问 两 组 的 平均 效 价 有 无 差别 ? 
钧 端 螺 旋 体 病 患 者 凝 溶 试 验 的 稀释 倍数 


标准 株 100 200 400 400 400 400 800 1600 1600 1600 3200 3200 3200 
水 生 株 100 100 100 200 200 200 200 400 400 800 1600 











5. 为 比较 男 、 女 大 学 生 的 血清 谷 胱 甘 肽 过 氧化 物 酶 (GSH-Px ) 的 活力 是 否 相同 ， 某 医 
生 从 某 大 学 18~22 岁 大 学 生 中 随机 抽查 男生 48 名 、 女 生 46 名 ,测定 其 血清 谷 胱 甘 肽 过 氧 
化 酶 含量 ( 活力 单位 ), 男 、 女 性 的 均 数 分 别 为 96.53 和 93.73, 男 、 女 性 标准 差分 别 为 7.66 和 
14.97。 问 男女 性 的 GSH-Px 是 否 相 同 ? 








( 沈 其 君 ， 董 长 征 ) 





笔记 





| 故 


第 八 章 方 莹 四 桥 seen 疾 


上 一 章 介 绍 了 两 个 样本 均 数 比较 的 :检验 , 而 对 于 多 于 两 组 (x>2) 样 本 均 数 的 比较 ,1 检验 
不 再 适用 ,方差 分 析 (analysis of variance, ANOVA ) 则 是 解决 上 述 问题 的 重要 分 析 方 法 。 方 差分 
析 由 R.A.Fisher(1923) 首 先 提出 , 故 又 称 为 所 检验 , 其 基本 思想 是 将 全 部 观测 值 的 总 变异 按 影 
响 因素 分 解 为 相应 的 若干 部 分 变异 , 在 此 基础 上 , 计算 假设 检验 的 统计 量 瑟 值 , 实现 对 总 体 均 
数 是 否 有 差别 的 推断 。 


第 一 节 ”完全 随机 设计 的 方差 分 析 


完全 随机 设计 (completely randomized design), 是 一 种 将 实验 对 象 随机 分 配 到 不 同 处 理 组 
的 单 因 素 设 计 方法 。 该 设计 只 考察 一 个 处 理 因素 , 通过 对 该 因素 不 同 水平 组 间 均 值 的 比较 , 推 
断 该 处 理 因素 不 同 水 平 之 间 的 差异 是 否 具有 统计 学 意义 。 完 全 随机 设计 的 数据 结构 一 般 形式 
如 表 8-1 所 示 , 其 中 为 处 理 因素 的 水 平 数 ,%, 为 处 理 因素 第 i 水 平 的 第 j 个 观测 值 ,mu(i= 1， 
2,…,) 为 处 理 因素 第 i 水 平 组 的 观测 例 数 ,n 为 总 例 数 , 蕊 为 处 理 因素 第 ;水平 组 的 均 数 , 闷 为 


| 总 均 数 ,8 为 处 理 因素 第 ;水 平 组 的 方差 , 8? 为 全 部 观测 值 的 方差 。 


表 8-1 完全 随机 设计 方差 分 析 的 数据 结构 




















处 理 因素 和 
[=] 
水 平 1 。 ”水平 2 … 水 平 / 到 水 平 k 

Xi hl Wi Xn 人 Xi 

Xz 了 2 cy Xn mt Xe 

Xy 和 5 i 2 6 

演 和 a 所 i 六 
We nl ny ni nk n 
总 沽 Bak 天 Sw 六 到 
S? Se S2 we Ss2 上 S2 Ss? 





表 8-1 中 ,n 个 观测 值 彼此 不 同 ,可 以 用 方差 来 反映 其 变异 程度 。 方 差 的 分 子 部 分 为 个 观 


测 值 的 离 均 差 平方 和 , 称 为 总 变异 ( 记 为 Se ), 对 此 可 以 作 如 下 分 解 : 





SSs = 六 证 cx 一 成) = pp [CXy—X) + -7X 


=1 j=) i=l j=l 
下 下 机 i 
= Yn _T+ FY, —X) +22, > ,0 — XK X) 
和 1 i=] j= i=1 j=l 
| 其 中 
2 —X)X—X)=0 
i=l j= 





SS = Sa = 这 + yy, = 
i=1 


i=l j=l 


70 
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其 中 ， Yn (X, -也 )? 称 为 组 间 变 异 , 记 为 SSgm, 反映 了 处 理 因素 各 个 水 平 组 间 的 差异 , 同时 也 


包含 了 随机 误差 ; 交 光 (CX, -不 称 为 组 内 变异 , 记 为 SS, 反映 了 各 组 内 样本 的 随机 波动 。 


”由 此 可 见 , 总 变异 SSg 可 以 分 解 为 组 间 变 异 SSam 和 组 内 变异 SSan, 即 

SSg= SSam 二 SSanm (8-1) 
其 中 , 总 变异 自由 度 vs=n1, 组 间 变 异 自由 度 vigm=k 一 1, 组 内 变异 自由 度 =n 一 k。 对 于 自由 
度 ,同样 有 





总 二 组 间 十 V 组 内 (8-2) 


上 述 各 部 分 变异 除 以 相应 自由 度 得 到 相应 平均 变异 , 即 方差 (通常 称 均 方 )。 组 间 均 方 为 


0 
Mam = Sm Sw (83) 
组 间 
组 内 (误差 ) 均 方 为 
SS, SS, 
MMS 二 一生 内 组 内 (8-4) 


检验 各 处 理 组 均值 之 间 有 无 差异 这 一 假设 可 以 通过 比较 MSam 和 MSam 来 实现 。MSgm 与 MSam | 


之 比 即 构成 了 方差 分 析 的 统计 量 , 即 
MS, 


FF= 一 和 (8-5) | 


MS 


可 以 证 明 , 当 原 假设 辆 成 立时 ,统计 量 下 服从 自由 度 为 (x 一 1,n 一 k) 的 五 分 布 。F 值 接近 
1, 可 认为 均值 的 差异 只 源 于 随机 波动 , 而 非 处 理 因素 作用 ; 己 值 大 于 1 并且 F>F.ww,P<a， 
则 按 a 水 准 拒绝 ,表明 有 随机 波动 之 外 的 处 理 因 素 造成 了 均值 的 差异 。 

以 上 计算 过 程 可 用 完全 随机 设计 方差 分 析 表 ( 表 8-2 ) 进 行 概括 。 





表 8-2 ”完全 随机 设计 的 方差 分 析 表 
变异 来 源 平方 和 ( SS) 自由 度 (v) 均 方 ( MS) F 值 








大 区 Pe 
总 变异 SS = ,DX -X=n-DS vo=n-1 


EL 疡 1 





人 SS am 
处 理 组 间 SS = > nC 一)? vam=k—1 am 一 人 < 
理 组 间 组 问 > 组 间 | Msn 
Sm 
组 内 (误差) SSum=SSe 一 SSan anya-yam Msn = 
组 内 





注 : 方差 分 析 表 中 自由 度 v 常 以 DF 表示 


例 8-1 在 评价 某 药物 耐 受 性 及 安全 性 的 I 期 临床 试验 中 ,将 符合 纳入 标准 的 30 名 健康 自 
愿 者 随机 分 为 3 组 , 每 组 10 名 ,各 组 注射 剂量 分 别 为 0.5U、1U、2U, 观察 48 小 时 部 分 凝血 活 酶 
时 间 (s), 结果 见 表 8-3。 试 问 不 同 剂量 组 的 部 分 凝血 活 酶 时 间 有 无 不 同 ? 

方差 分 析 具 体 步 又 : 

(1) 提出 检验 假设 ,确定 检验 水 准 

Ho: 44=1w=p, 即 三 个 组 部 分 凝血 活 酶 时 间 的 总 体 均 数 相 同 

本 :p44,p, 44 不 全 相同 , 即 三 个 组 部 分 凝血 活 酶 时 间 的 总 体 均 数 不 全 相同 

a=0.05 


1 
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| 表 8-3 三 种 不 同 剂量 组 48 小 时 部 分 凝血 活 酶 时 间 ( s) 














0.5U 1U 2U 合计 
36.8 40.0 32.9 
34.4 35.5 37.9 
34.3 36.7 30.5 
35.7 39.3 31.1 
33.2 40.1 34.7 
31.1 36.8 37.6 
34.3 33.4 40.2 
29.8 38.3 38.1 
35.4 38.4 32.4 
31.2 39.8 35.6 
n; 10 10 10 30(n) 
到 33.62 37.83 35.10 35.5167(X) 
六 2.2636 2.2071 3.3133 3.1072(S) 
(2) 计算 检验 统计 量 F 值 
SSs =(n—DS’*=(30—)) x3.1072* =279.9861 
vs =30—1=29 


SSam = 2 nCXi —X) 
Ee 


=10x(33.62—35.5167)* +10x(37.83—35.5167) +10x(35.10 一 35.5167) 
=91.2247 
van =3—1=2 


SS 
MSam = 1.2247 _ 5 6124 


SSan = SSe 一 SSam =279.9861—91.2247 =188.7614 





Van= Ve Van=29—2=27 


| MSgnw =— = =6.9912 
| 0 27 

| RMSam _ 45.6124 _ 052 

| MSnn 6.9912 


将 上 述 计算 结果 列 于 表 8-4 的 方差 分 析 表 中 。 


| 表 8-4 ”完全 随机 设计 的 方差 分 析 表 

















| 变异 来 源 SS v MS cit A 
| 总 变异 279.9861 29 

| 处 理 组 间 91.2247 2 45.6124 6.52 <0.05 
| 组 内 (误差 ) 188.7614 27 6.9912 Ss 

| 


(3) 确定 P 值 ,做 出 推断 结论 


A 


3 分 子 自由 度 vam= 2, 分 母 自由 度 vam= 27, 查 忆 界 值 表 ( 方 差分 析 用 ), 因 玉 界 值 表 中 无 
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V 组 内 一 27， 取 V 组 内 二 26, Foos(2,26)=2.52。 由 于 F> Foos(2.,20), 从 而 P<0.05, 按照 a=0.05 的 检验 水 
准 拒绝 国 , 可 以 认为 三 种 不 同 剂量 48 小 时 部 分 凝血 活 酶 时 间 不 全 相同 。 


第 二 节 ”随机 区 组 设计 的 方差 分 析 


随机 区 组 设计 (randomized block design ) 又 称 为 配伍 组 设计 , 其 做 法 是 先 将 受 试 对 象 按 条 
件 相 同 或 相近 组 成 m 个 区 组 (或 称 配伍 组 ), 每 个 区 组 中 有 个 受 试 对 象 ,再 将 其 随机 地 分 到 
个 处 理 组 中 。 随 机 区 组 设计 在 m 个 区 组 和 个 处 理 水 平 组 构成 mk 个 格子 ,每 个 格子 仅 一 个 数 
据 %(i=1,2,3,...,k;j=1,2,3,…,m), 其 方差 分 析 属 无 重复 数据 的 两 因素 方差 分 析 (two-way 
ANOVA), 数据 结构 如 表 8-5 所 示 。 


表 8-5 随机 区 组 设计 方差 分 析 的 数据 结构 











处 理 因 素 (A) 

人 水 平 1 水 平 2 …- 水 平 k 
区 组 1 Xl po 0 Xl 
区 组 2 Xl 2 ee Xs 
区 组 m 其。 六 3 7 








与 完全 随机 设计 方差 分 析 情 况 类 似 , 总 变异 SSs 可 分 解 为 处 理 组 的 变异 SSua、 区 组 的 变异 
SS& 租 以 及 随机 误差 SSi 关 , 即 





| 
| 
| 


SSg= SSimt+ SS + SS (8-6) ， 


相应 的 自由 度 有 
V 总 王 V 处 理 十 V 区 组 十 Vy 误差 (8-7) 


式 (8-6) 中 的 各 项 计算 与 完全 随机 设计 的 方差 分 析 相 同 , 只 需要 另外 计算 SSgg, 即 


SS = > ,KOX, — FY (8-8) | 
=1 





其 中 , 总 为 各 区 组 的 均 数 ,m2 和 kk 分别 为 区 组 和 处 理 的 水 平 数 。 上 述 计算 公式 归纳 在 方差 分 析 
表 中 ( 见 表 8-6)。 需 要 注意 的 是 , 由 于 公式 中 使 用 了 处 理 组 间 和 区 组 间 的 均 数 (传统 方法 是 求 和 
计算 ), 手工 计算 可 能 出 现 较 大 的 误差 , 实际 应 用 中 最 好 采用 统计 软件 进行 计算 。 





表 8-6 随机 区 组 设计 的 方差 分 析 表 
变异 来 源 平方 和 ( SS ) 自由 度 ( v) 均 方 ( MS) F 值 


1 IR 
总 变异 S58 = 2 > - X=-DS? ve=n-l 
i=1 j=! 

















上 了 SS, MS 
处 理 间 SSxm= > m(X;—X) vu=k—1 MS = 一 4 i 
en 人 旦 识 关 
(一 羡 Sg MStzm 
区 组 间 9Sgaa = Dk, -XY VY 区 组 一 7 一 1 MSF = 一 于 有 ka = WMS 
/= TV 区 组 误差 
| 了 误差 一 了 总 一 Y 处 理 一 了 区 组 Sa 
误差 SSinn= SS — Su — SS a = 
误 益 二 鸣 3 总 一 99 处 理 一 959 区 组 ny i 





可 以 看 出 , 与 完全 随机 设计 相 比 , 随机 区 组 设计 方差 分 析 将 总 变异 分 解 为 三 部 分 , 即 除 处 理 
组 间 变 异 之 外 , 还 将 区 组 因素 导致 的 变异 也 分 离 出 来 , 从 而 减少 了 随机 误差 , 提高 了 实验 效率 。 
例 8-2 为 探讨 Rgl 对 鲍 诱 导 大 鼠 调 丸 损伤 的 保护 作用 , 研究 者 按照 窝 别 把 大 鼠 分 成 10 个 
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区 组 , 然后 将 同一 区 组 内 的 3 只 大 鼠 随机 地 分 配 到 三 个 实验 组 , 分 别 给 与 不 同 处 理 , 一 定时 间 后 
测量 大 鼠 的 睾丸 MT 含量 (hg/g), 数据 如 表 8-7 所 示 。 试 比较 三 种 不 同 处 理 对 大 鼠 MT 含量 有 无 




















差别 ? 
表 8-7 三 组 大 鼠 MT 含量 值 ( hg/g ) 

窝 别 对 照 组 氧化 饥 组 Rgl+ 氨 化 饥 组 又) 
1 40.6 78.3 116.3 78.4000 
2 44.8 86.0 124.6 85.1333 
3 36.7 To1 149.0 85.9333 
4 49.9 95.4 128.8 91.3667 
5 59.8 99.2 134.1 97.7000 
6 54.5 95.9 133.0 94.4667 
和 38.4 76.4 115.6 76.8000 
8 41.6 79.9 117.0 79.5000 
9 46.8 86.5 128.4 87.2333 
10 44.7 85.3 124.3 84.7667 
基 45.78 85.50 127.11 86.13( 玉 ) 

方差 分 析 步 又 如 下 : 


(1) 建立 检验 假设 , 确定 检验 水 准 

Jo: p=j=p, 即 三 组 大 鼠 MT 含量 的 总 体 均值 相同 

总 :AAA 不 全 相等 , 即 三 组 大 鼠 MT 含量 的 总 体 均 值 不 全 相同 
a=0.05 


(2) 计算 检验 统计 量 下 值 
S? =1214.705 62 
SSg =S*(n—1)=1214.705 62 x(30—1) =35 226.4630 
大 一 RE 
SSym = Ym (YX, —X)? 


I 
=10x(45.7800—86.1300)? +10x(85.5000 —86.1300)? +10x(127.1100 —86.1300)” 
=33078.7980 


SSzg = > CE — XY 
/j=l 


=3x(78.4000 一 86.1300)? +3x(85.1333—86.1300)? +.…+3x(84.7667 —86.1300)? 
1276.9630 


SSyx = SSu — SSim — SSixm = 35 226.463 —33 078.7980 —1276.9630= 870.7020 
将 上 述 计算 结果 列 于 表 8-8 的 方差 分 析 表 中 。 
表 8-8 随机 区 组 设计 的 方差 分 析 表 











变异 来 源 SS V MS F 值 
总 变异 35 226.4630 29 
处 理 组 间 33 078.7980 2 16 539.3990 341.92 
区 组 间 1276.9630 9 141.8848 2.93 
误差 870.7020 18 48.3723 
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(3) 确定 已 值 , 做 出 推断 结论 

对 于 处 理 因 素 , 根据 分 子 的 自由 度 和 分 母 的 自由 度 , 按照 a=0.05 的 显著 性 水 准 , 查 下 界 
值 表 ( 方 差分 析 用 ), Foosc2.18)=3.55; 由 于 下 =341.92, 玉 > Foos2,18), 故 P<0.05, 差别 具有 统计 学 
意义 (拒绝 所 ), 可 认为 三 组 大 鼠 MT 含量 的 总 体 均 数 不 同 , 即 不 同 处 理 对 大 鼠 MT 含量 有 影响 。 
同 理 , 可 以 看 出 不 同 窝 别 大 鼠 的 MT 含量 不 同 (P<0.05)。 


第 三 节 ”多 个 样本 均 数 的 两 两 比较 


根据 方差 分 析 的 结果 , 若 拒绝 名、 接受 也, 则 可 以 推断 上 组 均 数 不 全 相同 , 然而 , 究竟 哪些 
组 不 同 , 需要 进一步 对 多 个 样本 均 数 进行 两 两 比较 或 称 多 重 比较 (multiple comparison )。 对 此 若 
用 上 一 章 学 习 的 :检验 对 k 组 均 数 进行 两 两 比较 , 共 需 比较 加 i 2 51 次 ,如 =5, 需 要 进 
行 10 次 比较 , 若 规定 检验 水 准 a=0.05, 在 原 假 设 t 成 立 的 条 件 下 , 10 次 检验 均 不 犯 1 类 错误 
的 概率 为 0.95"=0.5987, 累积 犯 1 类 错误 的 概率 为 1 -0.5987=0.4013, 明显 大 于 0.05。 因 此 , 均 
数 间 的 多 重 比较 不 能 直接 使 用 两 均 数 比较 的 1 检验 。 

多 重 比较 的 方法 有 很 多 , 如 Dunnett-! 检验、LSD-1 检验、SNK-g(Student-Newman-Keuls ) 法 、 
Tukey 法 、Schéffe 法 、Bonferroni 1 检验 和 Sidak t 检 验 等 。 各 种 方法 的 适用 范围 参见 表 8-9。 


表 8-9 多 个 样本 均 数 两 两 比较 方法 选择 策略 











选择 方法 适用 范围 
Dunnett-! 检验 多 个 试验 组 与 一 个 对 照 组 均 数 差别 的 比较 。 
LSD-t 检 验 多 个 组 中 , 根据 专业 , 仅 进行 某 一 对 或 某 几 对 在 专业 上 有 特殊 探索 价值 的 均 数 间 的 
两 两 比较 。 
SNK-4 检验 任意 两 两 组 间 均 数 均 进行 比较 , 各 比较 组 样本 含量 可 不 相等 。 
Tukey 法 任意 两 两 组 间 均 数 均 进 行 比较 , 要求 各 比较 组 样本 含量 相同 。 
Schéffe 法 既 可 以 进行 因素 水 平 的 平均 效应 的 比较 , 还 可 比较 因素 水 平平 均 效应 的 线性 组 合 ， 


多 用 于 对 比 组 样本 含量 不 等 的 资料 。 
Sidak :检验 两 两 比较 时 检验 水 准 调整 为 w(w'= 1- 匆 =x , a 为 方差 分 析 原 检验 水 准 , m 为 两 两 比 
较 次 数 ), 以 使 多 次 比较 犯 1 类 错误 的 概率 控制 a 以 内 的 均 数 间 两 两 比较 。 


Bonferroni /检验 将 两 两 比较 时 检验 水 准 调整 为 w(a = 三 ), 以 使 多 次 比较 犯 类 错误 的 概率 控制 a 以 
内 的 均 数 间 两 两 比较 , 是 Sidak 1 检验 的 近似 。 











下 面 以 比较 常用 的 SNK 法 为 例 , 说 明 两 两 比较 方法 的 具体 应 用 。 
SNK 法 的 检验 统计 量 为 q, 故 又 称 为 q 检 验 。 其 计算 公式 为 
X, 2 ER 


(8-9) 





式 中 ,X,、 辽 ,分 别 为 任意 两 个 对 比 组 的 样本 均 数 ,分 母 为 两 组 均 数 之 差 的 标准 误 , mn4、ns 为 相应 
的 两 个 对 比 组 的 样本 例 数 , MSiay 为 方差 分 析 中 的 误差 均 方 。 

例 8-3 对 例 8-1 中 不 同 注射 剂量 组 受 试 者 部 分 凝血 活 酶 时 间 的 均 数 作 两 两 比较 。 

(1) 提出 检验 假设 , 确定 检验 水 准 

Ho: p14=14s, 即 任意 两 组 的 部 分 凝血 活 酶 时 间 的 总 体 均 数 相等 

到 : 14 关 La, 即 各 组 部 分 凝血 活 酶 时 间 的 总 体 均 数 不 等 或 不 全 相等 

a=0.05 
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(2) 计算 检验 统计 量 g 值 
首先 将 三 个 样本 均 数 由 大 到 小 排序 , 并 编组 : 
原 组 别 1U 2U 0.5U 
均 数 37.83 35.10 33.62 
组 次 1 务 3 
三 组 均 数 共 需 做 日 -G3 次 两 两 比较 。 


组 次 1 与 组 次 3 比较 : 
MSax=6.9912, Y=37.8300, X,=33.6200, m=10, n=10 


及 一 天 37.8300 —33.6200 





i ST 
2 【而 丙 2 \i0 10 
其 余 类 推 , 可 以 得 到 组 次 1 与 组 次 2、 组 次 2 与 组 次 3 比较 的 q 值 ,检验 的 了 值 可 以 通过 查 


附 表 5 得 到 ,将 所 有 计算 结果 与 guostc z) 界 值 列 于 表 8-10。 需 要 注意 : 如 果 组 次 1 与 组 次 3 比较 
结果 P>a, 后 面 就 不 需要 进行 检验 , 直接 判定 为 P>a。 








表 8-10 例 8-3 的 SNK 法 两 两 比较 计算 表 








对 比 组 A 与 B Xs -Xe 9 值 组 数 a qoosto,27) 界 值 P 值 
组 次 1 与 3 4.21 5.04 3 3:52 <0.05 
组 次 1 与 2 2.73 3.27 5 2.91 <0.05 
组 次 2 与 3 1.48 1.77 2 2.91 >0.05 





注 :本 例 vs=27,4 界 值 表 中 无 此 自由 度 下 临界 值 , 故 采用 内 插值 法 计算 相应 的 9 界 值 


(3) 确定 P 值 ,做 出 推断 结论 
以 误差 (组 内 ) 自 由 度 和 对 比 组 包含 的 组 数 a 查 g 界 值 表 , 经 查 表 , 若 4 值 大 于 或 等 于 4 界 


” 值 , 则 可 以 推断 比较 的 两 组 间 差 别 有 统 计 学 意义 , 否则 差别 无 统计 学 意义 。 由 表 8-10 可 知 , 1U 


与 20 组 ,1U 与 0.5U 组 比较 时 ,P<0.05, 拒 绝 包 ,差别 有 统计 学 意义 ,而 2U 组 与 0.5U 组 之 间 的 
差别 无 统计 学 意义 。 


第 四 节 方差 齐 性 检验 


方差 分 析 有 其 应 用 条 件 , 理论 上 要 求 各 样本 相互 独立 , 服从 正 态 分 布 且 方差 齐 同 。 相 对 而 言 ， 
方差 是 否 齐 同 对 检验 的 准确 性 影响 更 大 些 。 多 组 数据 的 方差 齐 性 检验 , 应 用 较 多 的 是 Bartlett 检 


| 验 法 和 Levene 检验 法 。Bartlett 检验 法 主要 适用 于 正 态 分 布 资料 的 方差 齐 性 检验 问题 , 如 资料 
| 不 服从 正 态 分 布 , 则 可 采用 Levene 检验 法 。 以 下 仅 介绍 Bartlett 检验 法 , 对 于 Levene 检验 法 ,有 


兴趣 的 读者 可 参考 有 关 书 籍 。 
对 于 Bartlett 检验 法 , 其 检验 统计 量 为 
,v1 (8-10) 
其 中 


大 
Q=>w-Dn(C21S2 (8-11) 
i=1 











人 二 寺 1 也 1 | 有 


3K-D\ 人 Sn-l n-k) | 
上 述 式 中 , 5? 为 第 i 组 的 方差 , 52 为 合并 方差 (对 完全 随机 设计 资料 有 S2= MSiazs ),k 为 比较 组 
数 , ni 为 第 i 组 样本 例 数 ,n 为 总 例 数 。 

当 样 本 来 自 独立 正 态 总 体 时 ,在 及 ,: 0?=02=…=o2 为 真情 况 下 , 该 检验 统计 量 服从 
v=K-1 的 所 分 布 。 样 本 方差 8? 差异 越 大 , 9, 越 大 , 刀 值 亦 越 大 。 如 果 刀 > 故 .， 则 P<a, 拒绝 
岳 , 可 认为 方差 不 齐 ; 反之 , 若 刀 < 准则 忆 >a, 不 拒绝 防 , 尚 不 能 认为 方差 不 齐 。 | 

例 8-4 ”对 例 8-1 资料 作 方差 齐 性 检验 。 

(1) 提出 检验 假设 , 确定 检验 水 准 

古 : 咱 =o3= oj, 即 三 个 总 体 方差 相等 

已: oo ao 不 全 相等 























a=0.10 
(2) 计算 检验 统计 量 ? 值 
本 例 : 
k=3, m=n,=n3=10, n=30 
S1=2.2636, 9=2.2071, S,=3.3133 
MSway= 6.9912 
大 
Q=> -DIn(s/S) 
i=] 
6.9912 
0 DR pao pan 2 a0 Dn 
2.2636? 2.2071 3.3133 
=1.9872 
1 E 1 1 
三 1 十 EE 
2 mS 二 
1 ( 1 1 1 1 ] 
=1+ 区 | 一 一 一 一 后 十 一 
3x(G3-1D \10-1 10-1 10-1 30-3 
=1.0494 
2 0 .19872 1 89. y=3_1=2 
QO, 1.0494 
(3) 确 定 P 值 ,做 出 推断 结论 


自由 度 v=2, 查 多 界 值 表 , 允 wo.2=4.61。 由 于 =1.89, 必 < 允 w0.2, 故 P>0.10, 按照 a=0.10 
的 检验 水 准 , 不 拒绝 色 , 尚 不 能 认为 三 个 总 体 方差 不 齐 。 


第 五 节 ”其 他 设计 类 型 的 方差 分 析 


一 、 析 因 设 计 
析 因 设计 (factorial design) 是 一 种 多 因素 多 水 平 交叉 组 合 的 实验 设计 方法 。 在 医学 研究 中 ， 
如 果 涉 及 两 个 或 多 个 处 理 因素 , 而 研究 者 希望 了 解 各 处 理 因素 的 效应 以 及 因素 间 的 交互 作用 
时 , 则 可 以 采用 析 因 设计 方法 。 这 里 只 介绍 具有 2 个 处 理 因素 、 每 个 因素 有 2 个 水 平 , 即 所 谓 的 
2x2 析 因 设计 的 方差 分 析 。 
假设 有 A 和 B 两 个 因素 , 因素 A 的 2 个 水 平分 别 用 4,、4, 表示 , 因素 B 的 2 个 水 平分 别 用 
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的 第 大 个 观测 数据 , 其 数据 结构 见 表 8-11。 


Bi、B, 表示 ,共有 四 种 不 同 的 组 合 。 现 在 每 种 组 合 下 各 进行 了 rv 个 观测 , Xi 表示 在 4B 条 件 下 











“ 主 效应 ”与 “交互 作用 ”, 以 及 如 何 进行 方差 分 析 , 通过 下 面 实例 加 以 说 明 。 


《BAFL) 中 的 IL-4(pg/ml) 水 平 , 观测 结果 见 表 8-12。 


表 8-11 2x2 析 因 设 计 的 数据 格式 
B 因 
人 A 因素 B 本 已 
<} 
A Ks Ks Hr HKi21s Ks, Ki 
A; > TD oe Fa, Kas, Ko 


2x2 析 因 设计 方差 分 析 的 目的 是 考察 A、B 两 因素 主 效应 及 两 因素 间 的 交互 作用 。 什 么 是 


例 8-5 在 一 项 动物 实验 研究 中 ,将 40 只 峻 性 小 鼠 做 成 哮喘 动 物 模型 ,然后 随机 分 为 4 组 ， 
接受 A 和 了 B 两 种 药物 不 同 组 合 的 处 理 , 即 4,8,、418;、42B1、42B,, 检测 小 鼠 支 气管 肺泡 灌 洗 液 
































为 -1.52; B 因素 固定 在 B, 水 平时 , A 因素 的 单独 效应 为 11.53。 





表 8-12 小 鼠 BALF 中 IL-4 值 (pg/ml) 
B 
A 因素 崎 
5; B, 
4 37.43 35.04 32.02 33.30 37.94 39.21 39.58 39.77 
36.83 36.88 30.58 38.19 33.63 32.62 43.50 27.41 
36.32 36.60 39.30 46.43 
4 30.57 36.27 37.76 30.63 45.11 54.15 51.61 52.45 
35.95 33.95 29.69 36.06 46.77 47.66 54.99 50.65 
32.44 34.69 42.71 48.60 
为 便于 说 明 , 将 表 8-12 数据 的 均 数 整理 成 表 8-13。 
表 8-13 例 8-5 资料 IL-4 值 均 数 整理 表 
B 因 
A 因素 到 均 数 B,-B 
一 & 有 
4 35.32 37.94 36.63 2.62 
4 33.80 49.47 41.64 15.67 
均 数 34.56 43.71 39.14 9.15 
4 一 4 -二 到 11.53 5.01 


| 1. 单独 效应 。 单 独 效应 (simple effect) 指 其 他 因素 水 平 固定 在 一 个 水 平时 , 某 一 因素 不 同 
水 平 之 间 均 数 的 差别 。 如 当 A 因素 固定 在 4, 水 平时 ,B 因素 的 单独 效应 为 2.62; 当 A 因素 固定 
| 在 清水 平时 , B 因素 的 单独 效应 为 15.67。 同 理 , B 因素 固定 在 有 水 平时 , A 因素 的 单独 效应 


2. 主 效应 ” 主 效应 (main effect ) 是 指 某 一 因素 各 个 水 平 间 的 平均 差别 。 如 A 因素 的 主 效应 
| 记 为 和 , 则 和 %=41.64-36.63=5.01; 同 理 , B 因素 的 主 效应 名 =43.71 一 34.56=9.15。 
| 3. 交互 效应 ”如果 一 个 因素 的 单独 效应 随 另 一 因素 的 水 平 变化 而 变化 , 而 且 其 变化 


不 能 用 随机 误差 解释 时 , 则 称 这 两 个 
因素 的 单独 效应 为 -1.52; 而 对 于 B， 


效应 , 记 为 Zs。 








局 度 
因素 间 存 在 交互 效应 (interaction effect )。 如 对 于 水 平 ,A 
水 平 , A 因素 的 单独 效应 为 11.53, 这 说 明 A 因素 与 B 因素 





的 效应 互 不 独立 , A 因素 单独 效应 依赖 于 B 因素 水 平 的 选择 , 即 A 因素 与 B 因素 之 间 存在 交互 
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4. 方差 分 析 按照 方差 分 析 基 本 思想 , 析 因 设计 中 , 观测 值 总 变异 SSs 可 分 解 为 以 下 四 个 


部 分 : 


相应 的 自由 


SSg=SS4+SSgt+ 554+ SIR 


度 为 





V 总 三 V4 十 Vg 十 V4B 十 V 误 关 
有 关 计 算式 归纳 于 表 8-14 的 方差 分 析 表 中 。 其 中 , 凶 为 A 因素 第 i 水 平 的 均 数 ,也 为 B 
素 第 /水平 的 均 数 ,X, 为 A 因素 i 水 平 .B 因素 j 水 平 组 合 下 的 均 数 ,5 为 总 标准 差 ,r 为 各 组 合 


(8-1 


(8-1 


3) 


4) 
因 





























的 重复 观测 例 数 。 
表 8-14 2x2 析 因 设计 方差 分 析 表 
变异 来 源 平方 和 SS 自由 度 v 均 方 MS F 值 
总 变异 S56 放生 帮 C va=2x2xr-1 
=(2x2xr 一 D8S: 

A 因素 SS = V2rCT -Ty w=2—1 MS4=S54 /va = 
Pa 误 凑 
ee MSs 

B 因 素 55 > vs=2—1 MSs=SSs/ va 2 

和 ;要 ek — MS's 
AB 因 素 5S4s=22r Oy -XY -S58Ss ve=(2-1)(2-1) MSw=SSa/vs Fe™ Ns. 
pr 误 莽 
误差 SSwx=SSw-SS4-SSs-SSug VR VE VA Ve Vs MSs = SS 
=2x2x(r-1) Vm 差 

本 例 2x2 析 因 设 计 的 方差 分 析 步 又 如 下 : 

(1) 提出 检验 假设 ,确定 检验 水 准 

Bo:=M, 即 A 因 素 两 个 不 同 水 平 的 IL-4 测 量 结果 相同 

已 o:MX/, 即 A 因素 两 个 不 同 水 平 的 IL-4 测 量 结果 不 同 

Hoisy: t=, 即 B 因素 两 个 不 同 水 平 的 IL-4 测量 结果 相同 

Hp: Tz 世 , 即 B 因素 两 个 不 同 水 平 的 IL-4 测量 结果 不 同 

Eua:A 与 B 无 交互 效应 

Hius: A 与 B 存 在 交互 效应 

a=0.05 

(2) 计算 检验 统计 量 下 值 

按 表 8-14 中 的 公式 计算 检验 统计 量 。 现 使 用 SPSS 统计 软件 进行 计算 , 结果 列 于 表 8-15 的 

方差 分 析 表 中 。 
表 8-15 2x2 析 因 设 计 方差 分 析 表 

变异 来 源 平方 和 SS 自由 度 v 均 方 MS FF 值 P 值 
总 变异 2055.1779 39 

A 因素 250.6504 1 250.6504 16.63 <0.05 

B 因素 836.2188 | 836.2188 55.48 <0.05 
AB 因素 425.6910 1 425.6910 28.24 <0.05 

误差 542.6177 36 15.0727 








笔记 
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(3) 确 定 P 值 ,做 出 推断 结论 

查 政界 值 表 , 对 于 A 因素 Foos0.36)=4.11, 羽 > Foost.36); P<0.05, 按照 a=0.05 的 检验 水 准 拒 
绝 ww, 认为 41 组 与 4; 组 IL-4 值 总 体 均 数 不 相 等 。 同 理 , 对 于 B 因素 Fs> Foos(1,36), P<0.05, 
拒绝 Fs), Bi 组 与 B, 组 IL-4 值 总 体 均 数 不 相 等 ;对 于 AB 交互 作用 , Ps> Foosu.36), P<0.05, 拒 
绝 otap), A 与 B 两 处 理 因素 存在 交互 作用 。 

二 、 重 复 测量 设计 

重复 测量 设计 (repeated measurement design ) 指 同一 受 试 对 象 的 某 一 观察 指标 在 不 同时 间 点 
上 进行 多 次 测量 的 设计 方法 , 如 服用 某 种 药物 后 测定 不 同时 间 点 的 血 药 浓度 , 接受 治疗 后 在 不 
同时 间 点 上 对 某 指标 进行 测量 , 这 种 设计 方法 在 医学 研究 领域 中 有 着 广泛 的 应 用 , 常用 来 分 析 
不 同 处 理 在 不 同时 间 点 上 的 变化 情况 。 

重复 测量 设计 与 随机 区 组 设计 有 相似 之 处 ,但 二 者 有 实质 性 差异 。 在 随机 区 组 设计 中 , 同 
一 区 组 的 每 一 受 试 对 象 随机 分 配 , 接受 不 同 的 处 理 ; 而 对 于 重复 测量 设计 , 通常 是 对 同一 受 试 
对 象 在 各 时 间 点 进行 测量 , 由 于 不 同时 间 上 的 测量 结果 可 能 存在 相关 性 , 因此 需要 采用 特殊 的 
统计 方法 进行 分 析 。 

例 8-6 将 手术 要 求 基 本 相同 的 15 名 患者 随机 分 为 3 组 , 在 手术 过 程 中 分 别 采 用 A、B、C 三 
种 麻醉 诱导 方法 , 在 Th( 诱 导 前 )、T、、、T 五 个 时 相 测 量 患 者 的 收缩 压 , 数据 记录 见 表 8-16。 





表 8-16 不 同 麻醉 诱导 时 相 患 者 的 收缩 压 (mmHg ) 











本 Ss 麻醉 诱导 时 相 

患者 序号 诱导 方法 元 元 元 这 元 
A 120 108 112 120 117 
2 A 118 109 115 126 123 
3 A 119 112 119 ~ 124 118 

4 A 121 112 119 126 120 
5 A 127 121 1 133 126 

6 B oi 120 118 131 137 
7 B 122 121 119 129 133 
8 B 128 129 126 135 142 
9 B 117 115 111 123 131 
10 B 118 114 116 123 133 
11 [9 131 119 118 135 129 
12 B 129 128 121 148 132 
13 C 123 123 120 143 136 
14 C 123 121 116 145 126 
15 站 125 124 118 142 130 





该 实例 为 两 因素 重复 测量 设计 资料 , 其 总 变异 包括 两 部 分 , 一 部 分 为 受 试 对 象 间 的 变异 ， 
男 一 部 分 为 受 试 对 象 内 的 变异 。 其 中 受 试 对 象 间 的 变异 又 分 为 处 理 因素 ( 例 8-6 中 的 A、B、C 三 
种 麻醉 诱导 方法 ) 的 变异 和 个 体 间 误 差 两 部 分 , 而 受 试 对 象 内 的 变异 则 分 为 时 间 因 素 的 变异 、 处 
理 和 时 间 的 交互 效应 以 及 个 体 间 误差 三 部 分 , 总 变异 分 解 为 
SS =SS 受 jj 象 则 十 全 S 受 谍 对 银 内 
二 (SS4 埋 十 SS 体积 类) 十 (SShgig 十 SS 外 理 x 时 间 十 SS 个 体内 识 基 ) 
了 总 二 了 受 试 对 象 间 十 也 受 试 对 象 内 


三 (VV 外 理 二 个体 问 误 基 ) 十 (时间 十 处理 x 时 间 十 个 体内 误 关 ) 
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重复 测量 设计 资料 的 方差 分 析 计算 较为 复杂 , 一 般 采用 统计 软件 包 完成 , 在 此 不 给 出 具体 
计算 过 程 。 本 例 使 用 统计 软件 (如 SPSS ) 进 行 计 算 , 现 将 计算 结果 列 于 表 8-17 的 方差 分 析 表 中 。 


表 8-17 ”重复 测量 方差 分 析 表 











变异 来 源 SS v MS F Pp | 
受 试 对 象 间 处理 912.24 多 456.12 5.78 0.0174 
个 体 间 差 异 946.48 12 78.87 
受 试 对 象 内 ” 时间 2336.45 4 584.11 106.56 <0.0001 
处 理 x 时 间 837.63 8 104.70 19.10 <0.0001 
个 体内 误差 263.12 48 5.48 


结果 显示 : Fiam=5.78, P=0.0174, P<0.05, 按 a=0.05 的 检验 水 准 拒绝 加, 认为 不 同 处 理 组 | 
之 间 的 差异 有 统计 学 意义 。 同 理 , 对 于 麻醉 诱导 时 相 时 间 , Faymy=106.56, P<0.0001, 按 a=0.05 | 
的 检验 水 准 拒绝 及 ,说 明 不 同时 间 点 之 间 的 差异 有 统计 学 意义 ; 处 理 与 时 间 的 交互 作用 的 方差 | 
分 析 , Fam snm= 19.1, P<0.0001, 按 a=0.05 的 检验 水 准 拒绝 包 , 说 明 时 间 与 处 理 的 交互 作用 有 | 


es i pe 





练习 题 


一 、 单 项 选择 题 

1. 方差 分 析 的 基本 思想 是 ( ) 
A. 组 间 均 方 大 于 组 内 均 方 B. 组 内 均 方 大 于 组 间 均 方 
C. 不 同 来 源 的 方差 必须 相等 D. 两 方差 之 比 服从 下 分 布 | 
E. 总 变异 及 其 自由 度 可 按 不 同 来 源 分 解 


2. 方差 分 析 的 应 用 条 件 之 一 是 方差 齐 性 , 它 是 指 ( ) | 
A. 各 比较 组 相应 的 样本 方差 相等 B. 各 比较 组 相应 的 总 体 方差 相等 | 
C. 组 内 方差 等 于 组 间 方 差 D. 总 方差 等 于 各 组 方差 之 和 


E. 总 方差 = 组 内 方差 十 组 间 方 差 
3. 完全 随机 设计 方差 分 析 中 的 组 间 均 方 反 映 的 是 ( ) 


A. 随机 测量 误差 大 小 B. 某 因 素 效应 大 小 


E. 各 组 方差 的 平均 水 平 


| 
C. 处 理 因素 效应 与 随机 误差 综合 结果 D. 全 部 数据 的 离散 度 
| 
4. 对 于 两 组 资料 的 比较 ,方差 分 析 与 ! 检 验 的 关系 是 ( ) 


| A. 1 检验 结果 更 准确 B. 方差 分 析 结 果 更 准确 
| 

| C. 1 检验 对 数据 的 要 求 更 为 严格 D. 近似 等 价 

| 





E. 完全 等 价 
. 多 组 均 数 比 较 的 方差 分 析 , 如 果 P<0.05, 则 应 该 进一步 做 的 是 ( ) 
| A. 两 均 数 的 1 检验 B. 区 组 方差 分 析 | 
C. 方差 齐 性 检验 D. SNK-d 检验 | 
E. 确定 单独 效应 
6. 完全 随机 设计 的 多 个 样本 均 数 比 较 , 经 方差 分 析 , 若 忆 <0.05, 则 结论 为 ( ) 
A. 各 样本 均 数 全 相等 B. 各 样本 均 数 全 不 相等 


Un 
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C. 至 少 有 两 个 样本 均 数 不 等 D. 至 少 有 两 个 总 体 均 数 不 等 

E. 各 总 体 均 数 全 相等 

7. 完全 随机 设计 资料 的 多 个 样本 均 数 的 比较 , 若 处 理 无 作用 , 则 方差 分 析 的 严 值 在 理论 上 
应 接近 于 ( 。 ) 


A. Va B. SS4t 理 /SS 关 
C.0 D. 1 
E. 任意 值 


8. 对 于 多 个 方差 的 齐 性 检验 , 若 P<a, 可 认为 ( ) 
A. 多 个 样本 方差 全 不 相等 B. 多 个 总 体 方差 全 不 相等 
C. 多 个 样本 方差 不 全 相等 D. 多 个 总 体 方 差 不 全 相等 
E. 多 个 总 体 方 差 相 等 
9. 析 因 设计 的 方差 分 析 中 ,两 因素 久 与 Y 具 有 交互 作用 指 的 是 (。” ) 
A. 了 和 了 的 主 效应 互相 影响 B. 蕊 与 了 对 观测 指标 的 影响 相差 较 大 
C. 于 与 了 有 夫 加 作用 D. 区 对 观测 指标 的 作用 受 了 水 平 的 影响 
E. 天 与 了 的 联合 作用 较 大 
10. 某 职 业 病 防治 院 测定 了 年 龄 相近 的 45 名 男性 用 力 肺 活 量 , 其 中 石棉 肺 患者 、 石 棉 
肺 可 疑 患 者 和 正常 人 各 15 名 ,其 用 力 肺活量 分 别 为 (1.79 主 0.74)L、2.31 士 0.87)L 和 
(3.08 士 0.65)L, 拟 推 断 石棉 肺 患 者、 石棉 肺 可 疑 患 者 和 正常 人 的 用 力 肺 活 量 是 否 不 同 ， 
宜 采 用 的 假设 检验 方法 是 ( 。” ) 
A. 两 组 均 数 比较 的 1 检验 B. 方差 齐 性 检验 
C. 完全 随机 设计 方差 分 析 D. 随机 区 组 设计 方差 分 析 
E. 析 因 设计 方差 分 析 
二 、 计 算 与 分 析 < 
1. 某 实 验 室 研究 人 员 检 测 了 三 种 病情 慢性 乙 型 肝炎 患者 血清 sFasL 水 平 ， 试 比较 不 同 
病情 乙 型 肝炎 患者 sFasL 水 平 是 否 不 同 ? 


慢性 乙 型 肝炎 及 献血 员 血 清 sFasL 水 平 (hg 人 L ) 








重度 慢性 乙 型 肝炎 中 度 慢 性 乙 型 肝炎 轻 度 慢性 乙 型 肝炎 

1.54 0.88 0.18 
1.52 0.91 0.31 
1.61 0.88 92 
1.62 0.82 0.17 
1.48 0.89 0.30 
1.67 0.92 021 
1.41 0.97 0.34 
1.57 0.72 0.24 
1.64 0.98 0.19 
1.50 0.98 0.19 
1.74 by 0.23 

0.20 

0.31 

0.17 











第 八 章 方差 分 析 








2. 为 探讨 小 剂量 地 塞 米松 对 急性 肺 损伤 动物 模型 肺脏 的 保护 作用 ,将 36 只 二 级 SD 
大 鼠 按 性 别 、 体 重 配 成 12 个 配伍 组 , 每 一 配伍 组 的 3 只 大 和 鼠 被 随机 分 配 到 对 照 组 、 损 伤 组 
与 激素 组 24 小 时 后 测量 支气管 肺泡 灌 洗 液 总 蛋白 水 平 (g/L), 结果 如 下 表 。 问 3 组 


















大 鼠 的 总 蛋白 水 平 是 否 不 同 ? 
3 组 大 鼠 总 蛋白 水 平 (g/L) 
配伍 组 对 照 组 损伤 组 激素 组 
1 0.36 1.48 0.30 
2 0.28 1.42 0.32 
六 0.26 1.33 0.29 
4 0.25 1.48 0.16 
和 0.36 1.26 0.35 
6 0.31 53 0.43 
3 0.33 1.40 0.31 
8 0.28 1.30 0.13 
9 0.35 1.58 0.33 
10 0.41 1.24 0.32 
11 0.49 1.47 0.26 
12 0.27 32 0.26 








3. 为 研究 唑 啉 酸 对 大 和 鼠 急 性 和 亚 急 性 炎症 的 影响 ,将 40 只 体重 为 200 土 20(g) 的 雄性 
Wistar 大 鼠 建 立 急 性 和 亚 急 性 炎症 动物 模型 , 然后 随机 分 为 四 组 ,每 组 10 只 ,给 予 不 同 的 处 
理 , 观 察 其 WBC 值 。 四 种 处 理 分 别 为 : 腹腔 注射 生理 盐水 后 3 小 时 处 死 、 腹 腔 注 射 生理 盐 
水 后 6 小 时 处 死 、 腹 腔 注 射 唑 啉 酸 (0.35mg/g) 后 3 小 时 处 死 、 腊 腔 注射 峰 呆 酸 (0.35mg/g) 
后 6 小 时 处 死 。 实 验 结果 如 下 表 。 问 唑 啉 酸 及 作用 时 间 对 WBC 值 是 否 有 影响 ? 





不 同 药物 与 不 同时 间 大 鼠 WBC 值 

















生理 盐水 座 啉 酸 
3 小 时 6 小 时 3 小 时 6 小 时 
S13 19.0 15.8 13.9 
21.9 25.2 8.7 15.8 
ky 22.9 9.4 18.3 
16.3 19.8 = 你/ 13.0 
17.9 22.7 8.3 14.0 
18.8 23.0 11.0 19.0 
13.5 22.8 12.8 15.3 
22.6 17.8 12.5 19.2 
17.1 24.6 9.3 18.2 
14.6 25.3 11.0 17.3 











( 钟 晓 妮 ) 
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好 检验 ( chi-square test) 是 英国 统计 学 家 Pearson 提出 的 一 种 主要 用 于 分 析 分 类 变量 数据 的 
假设 检验 方法 , 该 方法 主要 目的 是 推断 两 个 或 多 个 总 体 率 或 构成 比 之 间 有 无 差别 。 


第 一 节 ”四 格 表 资 料 的 x 检验 


例 9-1 为 了 解 呵 达 帕 胺 片 治疗 原 发 性 高 血压 的 疗效 ,将 70 名 高 血压 患者 随机 分 为 两 组 ， 
试验 组 用 吗 ] 达 帕 胺 片 加 辅助 治疗 , 对 照 组 用 安奈 剂 加 辅助 治疗 , 观察 结果 见 表 9-1, 试 分 析 呵 达 
帕 胺 片 治 疗 原 发 性 高 血压 的 有 效 性 。 


表 9-1 两 种 疗法 治疗 原 发 性 高 血压 的 疗效 











组 别 有 效 无 效 合计 有 效率 (% ) 
对 照 组 20(25.8)a 24(18.2)b 44(a+b) 45.45 
试验 组 21(15.2)c 5(10.8)d 26(c+d) 80.77 

合计 41(atc) 29(b+d) 70(n) 58.57 





本 例 为 两 样本 率 比较 的 资料 , 表 9-1 中 的 数字 a, 5, c, qd 是 该 表 的 四 个 基本 数据 , 进而 可 以 
计算 出 各 行列 周边 的 合计 数 和 两 组 的 有 效率 , 对 此 称 之 为 四 格 表 (fourfold table ) 资 料 。 四 格 表 
资料 可 以 用 六 检验 推断 两 个 总 体 率 之 间 有 无 差别 。 


一 、 好 检验 的 通用 公式 
x 检验 的 检验 统计 量 为 之 ,其 通用 的 基本 公式 为 
好 = 工人 六,,-( 行 数 -0)( 列 数 -1) (9-1) 


式 中 ,4 为 实际 频数 (actual frequency ), 7 为 理论 频数 (theoretical frequency ),v 为 自由 度 。 式 
(9-1) 服 从 自由 度 为 vy 的 字 分 布 。 

对 于 四 格 表 资料 , 理论 频数 了 根据 检验 假设 所 : z= 友 确定 。 如 例 9-1 的 无 效 假设 是 试验 
组 与 对 照 组 治疗 原 发 性 高 血压 的 总 体 有 效率 相等 , 可 以 将 两 组 合计 的 有 效率 (58.57%) 作 为 各 
组 的 有 效率 。 按 照 这 一 假设 , 理论 上 对 照 组 44 例 原 发 性 高 血压 病 患者 中 的 理论 有 效 人 数 应 为 
(44x41)/70=25.77, 无 效 人 数 为 (44x 29)/70= 18.23; 同 理 , 试验 组 的 26 例 原 发 性 高 血 庄 病 惠 
者 中 的 理论 有 效 人 数 为 (26 x41)/70= 15.23, 无 效 人 数 为 (26x 29)/70= 10.77。 计 算 理 论 频数 了 
的 公式 为 











二 (9-2) 


式 中 友 为 第 i 行 第 j 列 的 理论 频数 ,n. 和 nn, 分 别 为 相应 行 与 列 的 周边 合计 数 ,为 总 例 数 。 

由 式 (9-1) 可 以 看 出 , 刀 值 反映 了 实际 频数 与 理论 频数 的 吻合 程度 。 若 检验 假设 Ho 成立， 
实际 频数 与 理论 频数 的 差 值 应 该 较 小 , 即 妇 值 也 应 该 较 小 ; 反之 , 车 检验 假设 Fo 不 成 立 , 实际 
频数 与 理论 频数 就 会 相差 较 大 , 则 妃 值 也 会 较 大 。 刀 值 的 大 小 也 取决 于 (4 一 7) /了 的 个 数 多 少 
(自由 度 ” 的 大 小 ) 由 于 各 (4- 7)2/7 皆 为 正 值 , 故 自由 度 v 愈 大 , 刀 值 也 会 愈 大 ; 所 以 只 有 考 
虑 了 自由 度 * 的 影响 ,好 值 才能 正确 地 反映 实际 频数 4 和 理论 频数 了 的 吻合 程度 。 
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四 格 表 资料 只 有 两 行 两 列 , 在 周边 合计 数 固定 的 情况 下 , 四 个 基本 数据 当中 只 有 一 个 数据 
可 以 自由 取 值 (v=1), 因此 , 对 于 四 格 表 资料 , 只 要 根据 式 (9-2 ) 计 算出 一 个 理论 值 1; 后 ,其 他 
三 个 理论 值 可 用 周边 合计 数 减 去 相应 的 理论 值得 出 。 如 例 9-1 中 , Th =(44x41)/70=25.8， 
Ts=44—25.8=18.2, Ti=41-25.8=15.2,7=26-15.2=10.8( 或 人 =29-18.2=10.8)。 

入 检验 时 , 要 根据 自由 度 v 查 ? 界 值 表 。 当 自由 度 v 确 定 后 ,x 分 布 曲线 下 右 侧 尾部 的 面 
积 为 a 时 , 横 轴 上 相应 的 允 值 记 作 尼 .,, 即 字 分 布 的 分 位 数 。 儿 值 与 P 值 的 对 应 关系 见 分 布 
界 值 表 。 由 ?分布 界 值 表 可 知 ,在 自由 度 v 确 定 后 ,x? 值 钝 大 ,P 值 愈 小 ; 反之 ,好 值 愈 小 ,已 值 
愈 大 。 若 检验 水 准 为 x, 当 妇 > 难 .时 , Psa, 拒绝 本 ,接受 锯 ; 当 廊 < 名,, 时 ,P>a, 不 拒绝 Ho。 

现 以 例 9-1 为 例 说 明太 检验 的 步骤 。 

(1) 建立 检验 假设 并 确定 检验 水 准 

Hh: 而, 即 试验 组 与 对 照 组 的 总 体 有 效率 相等 

刁 : zl 关 Te, 即 试验 组 与 对 照 组 的 总 体 有 效率 不 等 

a=0.05 

(2) 计算 检验 统计 量 

按 式 (9-2) 计 算 mi, 然后 利用 四 格 表 的 各 行列 的 合计 数 计算 ma Ti 和, 即 

Ti=(44x41)/70=25.77, 7,=44—25.77=18.23 
Di=41-25.77=15.23, T=26-15.23=10.77 





按 公 式 (9-1) 计 算 达 值 
， (20—25.77)* (24—18.23) (21-15.23)? (5—10.77) 
Ps 十 一 十 =8.40 
25.77 18.23 15.23 10.77 


v=(2—1)x(2—1)=1 





(3) 确 定 P 值 ,作出 推断 结论 

以 v=1 查 附 表 7 的 闻 分 布 界 值 表 , 得 P<0.005。 按 a=0.05 水 准 ,拒绝 包 , 接受 掺 , 可 以 
认为 两 组 治疗 原 发 性 高 血压 的 总 体 有 效率 不 等 , 即 可 认为 叫 达 帕 胺 片 治疗 原 发 性 高 血压 是 有 
效 的 。 

















一 、 四 格 表 资料 刀 检 验 的 专用 公式 


在 对 两 样本 率 比较 时 , 当 总 例 数 n>40 且 所 有 格子 的 T>5 时 , 可 用 ?检验 的 通用 公式 (9-1)。 
实际 应 用 时 , 为 省 去 计算 理论 频数 的 步 又 ,简化 计算 公式 ,常用 四 格 表 资 料 浆 检验 的 专用 公式 
(9-3) 计 算 检 验 统计 量 允 值 , 即 

这 (ad 一 bc)27 (9-3) 
Co+D)Cc+d)+c)O+cD) 

式 中 , ab、c 、d 为 四 格 表 的 实际 频数 ;(a+b)(c+a) La+c)(5+d) 分 别 是 周边 合计 数 ; zz 为 总 
例 数 , 即 2=a+b+c+ds 公式 (9-3) 中 相应 符号 见 表 9-1。 
仍 以 例 9-1 资料 为 例 , 用 公式 (9-3 ) 计 算 她 值 ,有 

2 (20x5—24x21)? x70 
44x26x41x29 
结果 与 通用 公式 (9-1) 计 算 的 结果 相同 。 


三 、 四 格 表 资料 检验 的 校正 公式 


闪 分 布 界 值 表 的 依据 是 j 分 布 , 其 分 布 是 连续 型 分 布 , 而 计数 资料 中 的 实际 频数 4 为 分 类 
资料 , 是 不 连续 的 。 因 此 , 用 公式 (9-1) 计 算 的 闪 值 查 界 值 表 所 得 的 概率 己 偏 小 , 特别 是 对 自由 
度 v=1 的 四 格 表 资料 的 影响 更 大 。 为 此 ,美国 统计 学 家 FYates(1934 年 ) 提 出 了 计算 闪 的 连续 


=8.40 











笔记 
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性 校正 法 (correction for continuity ), 其 校正 公式 为 


te (94) 


2 
,BE (lad— bc|—n/2)°n (9-5) 
(atDlc+ad)(a+o)(b +q) 


上 述 公式 分 别 是 对 通用 公式 (9-1) 和 专用 公式 (9-3 ) 的 校正 。 在 实际 工作 中 , 对 于 四 格 表 资料 ， 
通常 规定 为 : 

(1) 当 n=40 且 所 有 的 7>5 时 ,用 必 检 验 的 基本 公式 (9-1) 或 四 格 表 资 料 儿 检验 的 专用 公式 
(9-3 )。 
(2) 当 n>=40 但 有 1<7<5 时 ,用 四 格 表 资 料 多 检验 的 校正 公式 。 
(3) 当 n<40, 或 7T<1 时 ,用 四 格 表 资 料 的 Fisher 确 切 概率 法 (Fisher's exact test )。 
例 9-2” 某 医师 欲 比较 胞 磷 胆 碱 与 神经 节 苷 脂 治疗 脑 血 管 疾病 的 疗效 , 将 58 例 脑 血管 疾病 
患者 随机 分 为 两 组 , 结果 见 表 9-2。 问 两 种 药物 治疗 脑 血 管 疾病 的 有 效率 是 否 不 同 ? 


表 9-2 ”两 种 药物 治疗 脑 血管 疾病 有 效率 的 比较 











药物 分 组 有 效 无 效 合计 有 效率 (% ) 
胞 磷 胆 碱 组 25(23.7) 3(4.3) 28 89.29 
神经 节 苷 脂 组 24(25.3) 6(4.7) 30 80.00 
窟 计 49 9 58 84.48 





注 : 括号 内 数字 为 理论 频数 


(1) 建立 检验 假设 并 确定 检验 水 准 
如: z=wo, 即 两 种 药物 治疗 脑 血管 疾病 的 有 效率 相等 


HH: zz#zw, 即 两 种 药物 治疗 脑 血 管 疾病 的 有 效率 不 等 
a=0.05 


(2) 计算 检验 统计 量 

按照 公式 (9-2) 计 算 各 观察 值 的 理论 频数 , 记 于 表 9-2 的 括号 中 。 本 例 n=58, 但 有 2 个 格子 
的 理论 频数 分 别 43 和 4.7, 均 为 1<T<5, 需 用 四 格 表 资 料 这 检验 的 校正 公式 (9-4) 或 公式 (9-5)。 
本 例 用 公式 (9.5 ) 计 算 校正 巡 值 


2 _ (|25x6—3x24|—58/2)? x58 
* 49x9x28x30 





=0.376 
v=(2-1)(2—1)=1 
(3) 确定 P 值 ,作出 推断 结论 
以 v=1 查 附 表 7 的 多 界 值 表 得 P>0.05。 按 a=0.05 水 准 , 不 拒绝 11, 尚 不 能 认为 两 种 药物 
治疗 脑 血管 疾病 的 有 效率 不 等 。 
四 、 四 格 表 资 料 的 Fisher 确切 概率 法 
当 四 格 表 资料 中 出 现 n<40 或 7<1, 需 改 用 四 格 表 资 料 的 Fisher 确切 概率 法 。 该 法 是 一 种 


直接 计算 概率 的 假设 检验 方法 , 其 理论 依据 是 超 几 何 分 布 (hypergeometric distribution )。 四 格 表 
的 确切 概率 法 不 属于 好 检 验 的 范畴 , 但 常 作为 四 格 表 资料 假设 检验 的 补充 。 





确切 概率 计算 法 的 基本 思想 是 : 在 四 格 表 周边 合计 数 固定 不 变 的 条 件 下 , 利用 公式 (9-6) 直 
接 计 算 表 内 四 个 格子 数据 的 各 种 组 合 的 概率 已, 然后 计算 单 侧 或 双 侧 累计 概率 ,并 与 检验 水 
准 a 比较 ,作出 是 否 拒绝 所 的 结论 。 
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(a+!l(lc+a)!(at+o!(b +a)! 
alblcld In! 
式 中 a, b,c,d,n 等 符号 的 意义 同 表 9-1, >,P=1; “为 阶乘 符号 , 0!=1。 
下 面 用 实例 说 明 其 检验 原理 和 检验 方法 。 | 
例 9-3 某 研究 者 为 研究 乙肝 免疫 球 蛋 白 预防 白 免 胎 儿 官 内 感染 HBV 的 效果 ,将 17 例 HBsAg 
阳性 白 免 随机 分 为 预防 注射 组 和 非 预防 组 , 观察 两 组 所 产 出 的 新 生 白 兔 HBV 感染 情况 , 结果 见 





已 = (9-6) 




















表 9-3。 问 两 组 新 生 白 免 的 HBV 总 体感 染 率 有 无 差别 ? 
表 9-3 ”两 组 新 生 白 免 HBV 感染 率 的 比较 
组 别 阳性 阴性 例 数 感染 率 (% ) 
非 预 防 注射 组 7 2 9 77.78 
预防 组 2 6 8 25.00 
合计 8 9 17 47.06 








本 例 n=17<40, 不 满足 刀 检 验 的 应 用 条 件 , 宜 用 Fisher 确切 概率 法 。 其 假设 检验 步骤 如 下 : 

(1) 建立 检验 假设 并 确定 检验 水 准 

Hoo: =n, 即 两 组 新 生 白 免 HBV 的 总 体感 染 率 相等 | 

了 到: zl 总, 即 两 组 新 生 白 免 HBV 的 总 体感 染 率 不 等 | 

a=0.05 

(2) 计算 概率 

在 四 格 表 周 边 合计 数 不 变 的 条 件 下 , 表 9-3 内 4 个 实际 频数 变动 的 组 合 数 共 有 “周边 合计 中 
最 小 数 +1” 个 即 8+1=9 个 ,根据 公式 (9-6) 计 算 各 种 组 合 的 四 格 表 概 率 , 结果 见 表 9-4。 例 如 
实际 观察 到 的 四 格 表 资料 的 概率 为 | 

918!81!9! | 


已 = 一 一 一 一 -=0.041464 | 
7121216117! 


表 9-4 各 种 组 合 的 四 格 表 计算 的 概率 

















四 格 表 序号 阳性 阴性 a- 万 P 
1 1 8 -3.76 0.000370 
8 0 
2 2 gh -2.76 0.011847 
用 1 
3 3 6 -1.76 0.096750 | 
6 2 | 
4 4 5 -0.76 0.290251 | 
5 3 | 
5 5 4 0.24 0.362 814 
4 4 
6 6 3 1.24 0.193 501 
3 5 
入 区 交 2.24" 0.041464" 
6 
8 8 1 3.24 0.002962 
1 8 
9 9 0 4.24 0.000041 
0 8 





*+ 为 实际 数据 的 四 格 表 





[3 
we 
KE 
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(3 ) 确定 累计 概率 已 值 , 作出 推断 结论 
双 侧 检验 : 在 四 格 表 周边 合计 数 不 变 的 条 件 下 ,a 值 的 理论 频数 为 Ti= 五 =(9x9)/17=4.76; 
在 实际 观察 频数 a=7 时 ,la 一 =|7 一 4.76|=2.24。 观 察 上 述 9 个 2x2 表 ,a 值 越 大 ,c 值 越 小 ， 
a 一 匈 值 越 大 ; a 值 越 小 , c 值 越 大 , a- 忆 值 越 小 。 若 拒绝 印 ,P 值 的 计算 应 包括 la 一 l=2.24 的 
四 格 表 的 概率 之 和 。 双 侧 累计 概率 尸 值 为 
P=P(1)+P(2)+P(7)+P(8)+P(9) 
=0.000370+0.011847+0.041464+0.002962+0.000041 
=0.0567 
根据 所 得 P 值 , 在 a=0.05 检验 水 准 下 ,不 拒绝 印 , 尚 不 能 认为 预防 注射 组 与 非 预防 组 的 新 


| 生 白 兔 HBV 的 总 体感 染 率 不 等 。 


单 侧 检验 : 若 本 例 有 充足 的 医学 知识 认为 预防 注射 组 的 感染 率 不 可 能 高 于 非 预防 组 , 则 可 
以 作 单 侧 检验 , 计算 包括 a 一 =2.24 的 四 格 表 的 概率 之 和 , 即 
P=P(7)+P(8)+P(9)=0.041 464+0.002962+0.000041=0.044 
根据 所 得 P 值 ,在 a=0.05 检验 水 准 下 , 拒绝 友 , 接受 所 。 可 以 认为 两 种 疗法 不 同 , 预防 注 
射 组 的 感染 率 低 于 非 预防 组 的 感染 率 。 
同一 资料 , 由 于 选择 假设 检验 的 单 侧 、 双 侧 不 同 , 得 出 了 不 同 的 结论 。 如 前 所 述 , 在 资料 分 
析 时 , 用 单 侧 检验 还 是 用 双 侧 检验 , 应 根据 研究 目的 在 实验 设计 阶段 确定 。 
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例 9-4 现 有 198 份 疾 标 本 , 每 份 标本 分 别 用 A、B 两 种 培养 基 培养 结核 菌 , 结果 见 表 9-5。 
问 A、B 两 种 培养 基 的 阳性 培养 率 是 否 不 等 ? 





表 9-5 两 种 培养 基 培 养 结核 菌 结果 

















通 
4 48(a) 24(b) 
er. 20(c) 106(d) 126 
合计 68 130 198 








本 例 为 配对 设计 的 计数 资料 。 配 对 设计 常用 于 两 种 检测 方法 、 两 种 诊断 方法 或 两 种 细菌 培 
养 方法 的 比较 , 其 特点 是 对 样本 中 各 观察 单位 分 别 用 两 种 方法 检测 或 处 理 , 然后 按 两 分 类 变量 
计数 结果 。 观 察 结果 有 四 种 情况 , 可 整理 成 表 9-5 的 形式 。 其 中 ,a、d 为 两 法 观察 结果 一 致 的 两 
种 情况 ,5b、c 为 两 法 观察 结果 不 一 致 的 两 种 情况 。 当 两 种 处 理 方法 无 差别 时 ,对 总 体 有 B=C， 
即 两 总 体 率 相等 机 =x。 由 于 是 样本 数据 ,抽样 误差 不 可 避免 ,样本 中 的 b 和 < 往往 不 等 (bc， 
等 价 于 两 样本 率 不 等 )。 为 此 ,可 以 使 用 McNemar 假 设 检验 方法 , 其 检验 统计 量 为 : 





(9-7) 
* b+c 
2 
eT (Le ea wd (9-8) 
b+c 


式 (9-7) 用 于 (b+c)>40, 式 (9-8) 用 于 (b+c)<40 的 情况 。 值 得 注意 的 是 , 该 法 一 般 用 于 样 
本 含量 不 是 很 大 的 资料 。 因 本 法 仅 考 虑 两 法 结果 不 一 致 的 情况 (b,c), 而 未 考虑 样本 含量 ”和 
两 法 结果 一 致 的 两 种 情况 (a, d), 当 半 很 大 且 a 与 4 的 数值 很 大 时 ( 即 两 法 的 一 至 率 较 高 ), 即使 
检验 结果 有 统计 学 意义 , 其 实际 意义 可 能 并 不 大 。 








验 假设 并 确定 检验 水 准 
Ho: B=C, 即 两 种 培养 基 的 阳性 培养 率 相等 
HH: BC, 即 两 种 培养 基 的 阳性 培养 率 不 相等 
a=0.05 | 
(2) 计算 检验 统计 量 | 
本 例 5+c>40, 用 式 (9-7) 计 算得 

， (24—20)? 
《 24+20 








=0.36, v=1 


(3) 确定 P 值 ,作出 推断 结论 | 
查 ? 界 值 表 ( 附 表 7) 得 P>0.05, 按 a=0.05 水 准 ,不 拒绝 友 , 尚 不 能 认为 两 种 培养 基 的 阳 | 
养 梁 不 同 。 | 

需要 注意 : 配对 设计 的 四 格 表 资料 只 能 用 配对 ?检验 , 而 不 能 随意 转化 为 两 组 独立 样本 的 
她 检验。 








第 三 节 RxC 列 联 表 资 料 的 x? 检 验 
| 
前 面 介 绍 了 两 个 样本 率 比较 的 ?检验 方法 。 本 节 介绍 具有 RR 行 和 C 列 的 列 联 表 ( 称 为 RxC | 
表 ) 资 料 的 刀 检 验 , 用 于 多 个 样本 率 或 多 个 构成 比 的 比较 。Rx C 表 资料 的 刀 检 验 仍 可 以 使 用 公 | 
式 (9-1 )。 

















一 、RxC 表 x 检验 的 专用 公式 | 
车 使 用 公式 (9-1), 需 先 计算 理论 频数 (i=1,2,…,R,j=1,2,…,C), 比较 烦琐 , 为 此 可 
将 其 化 简 后 得 Rx C 列 联 表 资 料 儿 检验 的 专用 公式 , 即 
当 
ez- 才 v=(R-1)(C-1) (9-9) 


Ni 








式 中 ,n 为 总 例 数 , 4; 为 列 联 表 中 第 i 行 和 第 j 列 格子 中 的 实际 频数 ,ni. 和 .分 别 为 相应 行 和 列 | 
的 周边 合计 数 。 在 无 效 假设 如 下 ,x 统计 量 服从 自由 度 为 v 的 分布 。 | 

例 9-5 某 医 院 用 三 种 方案 治疗 急性 无 黄姜 型 病毒 肝炎 254 例 , 观察 结果 见 表 9-6, 问 三 种 | 
方案 治疗 急性 肝炎 的 有 效率 是 否 不 同 ? 
| 


表 9-6 3 种 方案 治疗 急性 肝炎 的 效果 








组 别 例 数 有 效 无 效 有 效率 (% ) 
西药 组 100 51 49 51.00 
中 药 组 80 35 45 43.75 
中 西药 结合 组 74 59 15 79.73 
合计 254 145 109 57.09 





本 例 为 三 个 样本 率 的 比较 ,是 3x2 表 资料 。 

(1) 建立 检验 假设 并 确定 检验 水 准 | 
Jn: 二 种 治疗 方案 的 有 效率 相等 

:三 种 治疗 方案 的 有 效率 不 全 相等 

a=0.05 
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(2) 计算 检验 统计 量 
“ 按 式 (9-9) 计 算 妨 值 
S51 49” 35? 45? 597 15? 
X =254x 十 一 十 十 十 = 
100x145 100x109 80x145 80x109 74x145 74x109 


=254x(0.1794+0.2203+0.1056+0.2322 +0.3244 +0.0279 -TD 
=22.81 
y=(3—1)x(2—1)=2 
(3) 确 定 P 值 ,作出 推断 结论 
查 儿 界 值 表 得 P<0.05, 在 a=0.05 的 检验 水 准 下 ,拒绝 ,接受 到, 可 以 认为 三 种 疗法 的 
有 效率 有 差别 。 
例 9-6 某 研究 人 员 收 集 了 亚洲 、 欧 洲 和 北美 洲 人 的 A、B、AB、O 血型 资料 , 结果 见 表 9-7， 
问 不 同 地 区 人 群 的 血型 分 布 (构成 比 ) 是 否 不 同 ? 


表 9-7 世界 三 个 不 同 地 区 血型 样本 的 频数 分 布 











地 区 例 数 A B AB 0 
亚洲 1080 321 369 95 295 
欧洲 517 258 43 22 194 
北美 洲 995 408 106 37 444 
合计 2592 987 518 154 933 





本 例 为 三 个 样本 构成 比 的 比较 , 是 3x4 表 资料 。 
| (1) 建立 检验 假设 并 确定 检验 水 准 

如 : 不 同 地 区 人 群 血型 分 布 总 体 构成 比 相 同 

| 了 及 :不 同 地 区 人 群 血型 分 布 总 体 构 成 比 不 全 相同 
a=0.05 

(2) 计 算 检验 统计 量 

按 式 (9-9) 计 算 达 值 为 





2 3692 444? 
2 = 2592 321 4 -1|=297.38 
“3987x1080 518x1080 933x995 
v=(3—1)x(4—1)=6 
(3) 确 定 P 值 ,作出 推断 结论 
查 附 表 7 得 台 ws.6=12.59, ?>12.59, P<0.05, 在 a=0.05 检验 水 准 下 ,拒绝 本 ,可 以 认为 三 


个 不 同 地 区 的 人 群 血型 分 布 不 同 。 
二 、 多 个 样本 率 间 多 重 比较 


当 多 个 样本 率 比较 的 推断 结论 拒绝 包 、 接 受 所 时, 只 说 明 各 总 体 率 之 间 有 差别 , 但 不 能 说 
明 任 两 个 总 体 率 之 间 有 差别 。 多 个 样本 率 间 的 两 两 比较 若 直 接 用 四 格 表 资 料 的 x 检验 进行 多 
重 比较 ,将 会 增加 犯 1 类 错误 的 概率 。 为 此 ,需要 采用 多 个 样本 率 的 多 重 比较 方法 。 

多 个 样本 率 间 的 多 重 比 较 有 外 分 割 法 、Scheffé 可 信和 区间 法 和 Bonferroni 方法 ,应 用 这 些 方 
法 能 够 保证 假设 检验 中 T 类 错误 a 的 概率 不 变 。 这 里 仅 介绍 最 简单 的 Bonferroni 方法 , 其 基本 
过 











思想 是 根据 重复 检验 的 次 数 重新 规定 检验 水 准 a'。 这 是 一 种 比较 保守 的 方法 ,比较 的 组 数 不 宜 
，，。 记过 多 ,实际 中 通常 有 两 种 情况 。 
了 1. 多 个 实验 组 间 的 两 两 比较 分 析 目 的 为 k 个 实验 组 间 , 任 两 个 率 均 进行 比较 ,检验 水 准 
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a' 可 用 式 (9-10) 估 计 : 
a =A (9-10) 
Q) 
式 中 2]- 和 5 一》 为 需要 比较 样本 率 的 组 数 。 
2. 实验 组 与 同一 个 对 照 组 的 比较 “分 析 目的 为 各 实验 组 与 同一 个 对 照 组 比较 , 而 各 实验 
组 间 不 需要 比较 。 检 验 水 准 必 可 用 式 (9-11) 估 计 ，; 
Qs (9-11) 
大 一 1 


式 中 上 为 样本 率 的 个 数 , 即 需要 比较 样本 率 的 组 数 。 
例 9-7 对 例 9-5 中 表 9-6 的 资料 进行 两 两 比较 , 以 推断 是 否 任 两 种 疗法 治疗 急性 无 黄姜 型 
病毒 肝炎 的 有 效率 均 有 差别 ? 
本 研究 目的 为 三 个 实验 组 间 的 两 两 比较 , 检验 水 准 w 用 式 (9-10) 估 计 得 
i 0.05 0.05 


X = 一 -一 一 = 一 一 =0.0166 
3x(G3-D/2 3 


(1) 建立 检验 假设 并 确定 检验 水 准 

到 : zt 和 =Xg, 即 任 两 对 比 组 的 总 体 有 效率 相等 

到 :xa 去 Xe, 即 任 两 对 比 组 的 总 体 有 效率 不 等 

a=0.05 

〈2) 计算 检验 统计 量 

本 研究 目的 为 三 个 实验 组 间 的 两 两 比较 , 两 两 比较 的 2x 2 表 及 用 公式 (9-3) 分 别 计算 任 两 
对 比 组 的 检验 统计 量 妨 值 结 果 见 表 9-8。 

(3) 确 定 P 值 ,作出 推断 结论 

查 附 表 7, 按 a'=0.0166 检验 水 准 , 得 到 自由 度 v= 1 的 必 界 值 在 5.02~6.63 之 间 , 经 插值 法 
得 到 x?0o0w66.1 守 5.97, 任意 两 组 比较 的 己 值 结果 见 表 9-8。 西 药 组 与 中 药 组 相 比 ， 接受 及 ,两 组 之 
间 无 显著 性 差异 (P>0.0166); 中 西医 结合 组 与 单纯 使 用 中 药 组 或 西药 组 相 比 , 拒绝 甸 , 两 组 疗 
效 的 差异 具有 统计 学 意义 (P<0.0166), 说 明 中 西医 结合 治疗 急性 无 黄 癌 型 病毒 肝炎 具有 更 好 的 
疗效 。 


表 9-8 三 种 疗法 治疗 肝炎 有 效率 的 两 两 比较 




















对 比 组 有 效 无 效 次 部 x a 
西药 组 51 49 100 0.94<5.97 >0.0166 
中 药 组 35 45 80 
合计 86 94 180 
中 药 组 35 45 80 20.93> 5.97 <0.0166 
中 西药 结合 组 59 15 74 
合计 94 60 154 
we sR 49 100 15.10>5.97 <0.0166 
中 西药 结合 纪 59 15 74 
合计 110 64 174 








例 9-8 ”以 例 9-5 中 表 9-6 资料 中 的 西药 治疗 组 为 对 照 组 , 中 药 治疗 组 与 中 西药 结合 为 试验 
组 , 试 分 析 两 试验 组 与 对 照 组 的 总 体 有 效率 有 无 差别 ? 
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第 九 章 x 检 验 

本 研究 目的 为 各 试验 组 与 同一 对 照 组 的 比较 , 检验 水 准 必 用 公式 (9-11) 估 计 得 
全 = 二 00250 

(1) 建立 检验 假设 并 确定 检验 水 准 

Jn: zr=Nc, 即 各 试验 组 与 对 照 组 的 总 体 有 效率 相等 

到 :zrzXc, 即 各 试验 组 与 对 照 组 的 总 体 有 效率 不 等 

a=0.05 

(2) 计算 检验 统计 量 

本 例 为 各 试验 组 与 同一 对 照 组 的 比较 , 计算 多 统 计量 的 结果 见 表 9-8。 


(3) 确定 P 值 ,作出 推断 结论 

查 附 表 7, 台 0s.1=5.02, 按 w= 0.0250 水 准 , 中 药 组 与 西药 组 相 比较 , 接受 久 , 两 组 疗效 
无 显著 差异 (P> 0.025); 中 西药 结合 组 与 西药 相 比 , 拒绝 fo, 两 组 疗效 的 差异 具有 统计 学 意义 
(P<0.025), 说 明 中 西药 结合 治疗 急性 无 黄 庆 型 病毒 肝炎 的 疗法 优 于 单纯 用 西药 的 疗法 。 


三 、RxC 表 ?检验 的 注意 事项 


1. 一 般 认为 , Rx C 表 中 各 格子 的 理论 频数 不 应 小 于 1, 并 且 1<7<5 的 格子 数 不 宜 超过 格子 
总 数 的 115。 若 出 现 这 种 情况 , 可 通过 以 下 方法 解决 : 增加 样本 含量 , 使 理论 频数 增 大 ; @ 根 据 
专业 知识 , 考虑 删 去 或 合并 理论 频数 太 小 的 行 或 列 ; @ 改 用 Rx C 表 的 Fisher 确切 概率 法 。 

2. 多 个 样本 率 比 较 , 若 统计 推断 结果 拒绝 久 , 接受 友 时 , 只 说 明 各 总 体 率 之 问 总 的 来 说 有 
差别 , 但 并 不 能 说 明 任 两 个 总 体 率 之 间 均 有 差别 。 要 进一步 推断 , 需 做 多 个 样本 率 的 多 重 比较 。 

3. Rx C 表 的 办 检验 与 分 类 结果 的 排序 无 关 。 对 于 有 序 Rx C 表 , 如果 分 析 的 目的 不 是 对 
构成 比 进行 比较 , 例如 比较 两 组 的 疗效 , 试验 结果 为 “ 竣 愈 .显效 、 有 效 .无效 ”, 则 不 宜 使 用 多 











| 检验 , 对 此 可 以 选用 后 面 第 十 章 的 非 参 数 秩 和 检验 方法 。 





练习 题 
| 一、 单项 选择 题 
| 1. 两 样本 率 比 较 ,差别 具有 统计 学 意义 时 ,了 值 越 小 说 明 ( 。 ) 
A. 两 样本 率 差别 越 大 B. 两 总 体 率 差别 越 大 
C. 越 有 理由 认为 两 样本 率 不 同 D. 越 有 理由 认为 两 总 体 率 不 同 


E. 越 有 理由 认为 两 样本 率 相 同 
. 铭 比 较 两 组 阳性 反应 率 , 在 样本 量 非常 小 的 情况 下 (如 4<10, m5<10), 应 采用 的 假设 
检验 方法 是 (。 ) 


ID 


| A. 四 格 表 几 检验 B. 校正 四 格 表 久 检验 
C. Fisher 确切 概率 法 D. 配对 多 检验 


| E. 校正 配对 ?检验 


3. 进行 四 组 样本 率 比 较 的 必 检 验 ,如 XP>X hm.3, 可 认为 (。 ) 
A. 四 组 样本 率 均 不 相同 B. 四 组 总 体 率 均 不 相同 
C. 四 组 样本 率 相 差 较 大 D. 至 少 有 两 组 样本 率 不 相同 


E. 至 少 有 两 组 总 体 率 不 相同 
4. 从 甲 、 乙 两 文中 , 查 到 同类 研究 的 两 个 率 比较 的 如 检验 , 甲 文 妇 > 和 jn 己 文 洁 > ,5.1， 














可 认为 (”) 


A. 两 文 结果 有 矛盾 B. 两 文 结果 完全 相同 
C. 忠 夹 结 采 更 为 可 信 D. 乙 文 结果 更 为 可 信 


E. 甲 文 说 明 总 体 的 差异 较 大 

. 两 组 有 效率 比较 的 检验 功效 相关 因素 是 (  ) 
A. 检验 水 准 和 样本 B. 总 体 率 差别 和 样 术 含量 
C. 样本 含 这 和 样本 率 D. 总 体 率 差别 和 理论 频数 






Un 





6. 通常 分 析 四 格 表 需 用 连续 性 校正 如 检验 方法 的 情况 是 ( ) 
A. T<5 B. T<1 或 n<40 
C. T<1 且 7<40 D. 1<7T<5 且 n>40 


E. T<5 或 n<40 
7. 当 四 格 表 的 周边 合计 数 不 变 时 ,如果 某 格 的 实际 频数 有 变化 , 则 其 理论 频数 是 ( ) 


A. 增 大 B. 减 小 
C. 不 变 D. 不 确定 


E. 随 该 格 实 际 频数 的 增 减 而 增 减 
8. 对 四 种 药物 进行 临床 试验 , 计算 显效 率 , 规定 检验 水 准 a=0.05, 若 需 要 进行 多 重 比较 ， 
用 Bonferroni 方法 校正 后 的 检验 水 准 应 该 是 ( ) 


A NI B. 0.008 
C025 D. 0.005 
下 001 


9. 对 药物 的 四 种 剂量 进行 临床 试验 ,计算 有 效率 ,规定 检验 水 准 a=0.05, 车 需要 进行 多 重 
比较 ,用 Bonferroni 方法 校正 后 的 检验 水 准 应 该 是 ( ) 


A. 0.050 B. 0.010 
C. 0.025 D. 0.005 
E 0017 


10. 利用 娄 检 验 公式 不 适合 解决 的 实际 问题 是 ( ) 
A. 比较 两 种 药物 的 有 效率 B. 检验 某 种 疾病 与 基因 多 态 性 的 关系 
C. 两 组 有 序 试验 结果 的 药物 疗效 D. 药物 三 种 不 同 剂量 显效 率 有 无 差别 
E. 两 组 病情 “ 轻 、 中 、 重 ”的 构成 比例 
二 、 计 算 与 分 析 
1. 某 神经 内 科 医 师 观察 291 例 脑 梗 死 病人 ,其 中 102 倒 病 人 用 西医 疗法 ,其 他 189 例 
病人 采用 西医 疗法 加 中 医疗 法 ,观察 一 年 后 ,单纯 用 西医 疗法 组 的 病人 死亡 13 例 , 采 用 中 
西医 疗法 组 的 病人 死亡 9 例 , 请 分 析 两 组 的 病死 率 差 异 是 否 有 统计 学 意义 ? 
2. 某 医院 研究 中 药 治疗 急性 心肌 梗死 的 疗效 , 临床 观察 结果 见 下 表 。 问 接受 两 种 不 
同 疗 法 的 患者 病死 率 是 否 不 同 ? 


两 种 药 治疗 急性 心肌 梗死 的 疗效 
例 数 存活 死 医 病死 率 (% ) 

















68 65 3 4.41 
14 12 2 14.29 
82 77 5 6.10 























3. 某 医 师 观 察 三 种 降 血 脂 药 A, B,C 的 临床 疗效 ,观察 3 个 月 后 ,按照 患者 的 血脂 下 


降 程度 分 为 有 效 与 无 效 , 结果 如 下 表 , 问 三 种 药物 的 降 血 脂 效果 是 否 不 同 ? 











三 种 药物 降 血 脂 的 疗效 
药物 例 数 有 效 无 效 有 效率 (% ) 
145 120 55 82.76 
B 37 60 J 68.97 
@ 62 40 22 64.52 
合计 294 220 74 74.83 


4. 茶 医 师 按 照 白 血 病 患 者 的 发 病情 况 , 将 308 例 患 者 分 为 两 组 , 并 按 ABO 血型 分 类 
记 数 ,结果 见 下 表 。 试 问 两 组 患者 血型 总 体 构成 有 无 差别 ? 


308 例 急 、 慢 性 白血病 患者 的 血型 分 布 














血型 
组 别 例 数 着 全 可 A 
急性 组 189 60 47 61 21 
慢性 组 119 42 30 34 13 
合计 308 102 5 95 34 








5. 为 研究 某 补 镍 制剂 的 临床 效果 ,观察 56 例 儿 童 , 其 中 一 组 给 予 这 种 新 药 , 另 一 组 给 
予 钙 片 ,观察 结果 如 下 表 , 问 两 种 药物 预防 儿童 的 人 向 俊 病 患 病 率 是 否 不 同 ? 














两 组 儿童 的 斧 偿 病 患 病情 况 
组 别 病例 数 非 病 例 数 合计 患 病 率 { % ) 
新 药 组 8 32 40 20.0 
钙 片 组 6 10 16 37.5 
合计 14 42 56 25.0 





6. 某 医 院 147 例 大 肠 杆 菌 标本 分 别 在 A,B 两 种 培养 基 上 培养 , 然后 进行 检验 ,资料 
见 下 表 , 试 分 析 两 种 培养 基 的 检验 结果 是 否 有 显著 性 差别 ? 


A、B 两 种 培养 基 上 培养 大 肠 杆菌 标本 结果 
8B 培养 基 














A 培养 基 合计 
浊 59 36 95 

> 15 37 52 
合计 74 73 147 
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第 十 童 ” 非 参 数 秩 和 检验 


前 面 介绍 的 检验 方法 , 如 样本 均 数 的 :检验 、 方 差分 析 , 样本 率 比较 的 多 检验 , 都 是 在 总 体 
分 布 已 知 的 前 提 下 对 参数 进行 的 检验 , 即 参数 检验 方法 (parametric test)。 然 而 , 在 实际 中 有 些 
资料 总 体 分 布 类 型 未 知 , 或 者 不 符合 参数 检验 的 适用 条 件 , 这 时 可 以 使 用 不 以 特定 的 总 体 分 布 
为 前 提 , 也 不 针对 总 体 参数 做 统计 推断 的 方法 , 即 非 参数 检验 方法 (nonparametric test)。 

非 参数 检验 的 方法 有 很 多 , 本 章 仅 介绍 通过 样本 数据 排序 编 秩 后 , 基于 秩 次 比较 的 非 参数 
检验 。 这 种 方法 通常 适用 于 : Q@ 总 体 分 布 类 型 未 知 或 非 正 态 分 布 数据 ; @ 有 序 或 半 定 量 资料 ; 
@ 数 据 两 端 无 确定 的 数值 。 非 参数 检验 方法 的 优点 是 适用 范围 广 , 但 由 于 这 种 方法 只 是 利用 了 
数据 的 秩 次 信息 , 因此 当 数 据 满足 参数 检验 的 条 件 时 , 应 首选 参数 检验 , 否则 检验 效能 降低 ; 当 
数据 不 满足 参数 检验 的 条 件 时 , 才 应 选择 非 参 数 检验 方法 。 


第 一 节 ”配对 设计 资料 的 符号 秩 和 检验 


Wilcoxon 符号 秩 检验 (Wilcoxon signed-rank test), 由 Wilcoxon 在 1945 年 提出 ， 属于 配对 设计 
的 非 参数 检验 , 用 于 推断 配对 资料 的 差 值 是 否 来 自 中 位 数 为 零 的 总 体 。 其 基本 思想 : 假定 两 种 
处 理 效 应 相同 , 则 差 值 的 总 体 分 布 对 称 , 总 体 中 位 数 为 0, 也 就 是 说 样本 的 正 负 秩 和 绝对 值 应 相 
近 ; 反之 , 若 两 种 处 理 效应 不 同 , 则 差 值 总 体 中 位 数 不 为 0, 中 位 数 偏离 0 越 明显 , 样本 的 正 负 秩 
和 绝对 值 就 会 相差 越 大 , 原 假设 国 成 立 的 可 能 性 越 小 。 下 面 结合 实例 说 明 其 检验 方法 。 

例 10-1 ”临床 研究 白 疗 风 病人 的 IL-6 指标 在 白斑 部 位 与 正常 部 位 有 无 差异 , 检测 结果 如 
表 10-1 所 示 。 














表 10-1 自 疗 风 病人 的 不 同 部 位 白介素 指标 ( pg/ml) 








病人 号 白斑 部 位 正常 部 位 d=(3)-(2) 秩 次 
(1) (2) (3) (4) (5) 

1 40.03 88.57 48.54 6 

2 97.13 88.00 -9.13 二 2 

3 80.32 123.72 43.40 4 

4 25.32 39.03 13971 3 

5 19.61 24.37 4.76 1 

6 14.50 92.75 78.25 8 

7 49.63 121.57 71.94 E 

8 44.56 89.76 45.20 5 





合计 7.=34, 7T.=2 





(1) 建立 检验 假设 ,确定 检验 水 准 

Ho: My=0, 即 两 个 不 同 部 位 IL-6 水 平 差 值 的 总 体 中 位 数 为 零 

万: Myz#0, 即 两 个 不 同 部 位 IL-6 水 平 差 值 的 总 体 中 位 数 不 为 零 

&=0.05 

(2) 编 秩 次 并 求 秩 和 统计 量 

首先 求 出 各 对 数据 的 差 值 , 见 表 10-1 的 第 (4) 列 ; 然后 编 秩 次 , 按照 差 值 绝对 值 由 小 到 大 编 
秩 , 并 按 差 值 的 正 负 给 秩 次 加 上 正 负 号 ; 若 差 值 为 “0”, 舍 去 不 计 , 总 的 对 子 数 也 要 减 去 此 对 子 

95 
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第 十 章 ” 非 参数 秩 和 检验 


数 ( 记 为 n); 若 差 值 的 绝对 值 相等 , 取 其 平均 秩 次 。 最 后 , 分 别 求 正 负 秩 次 之 和 也 与 也 (参见 表 
10-1), 任 取 开 或 工 为 检验 统计 量 7, 本 例 选取 T=2。 

(3) 确 定 P 值 ,做 出 推断 

当 n<50 时 ,根据 hn 和 7T 可 查 配 对 设计 用 的 T 界 值 表 ( 附 表 8), 若 检验 统计 量 了 7 值 在 上 下 界 
值 范 围 内 , 则 忆 值 大 于 表 上 方 对 应 的 概率 值 ; 若 T 值 在 上 下 界 值 外 , 则 P 卫 值 小 于 表 上 方 对 应 的 
概率 值 。 本 例 n=8, 查 T 界 值 表 To0scsy=3~33,7=2 不 在 3~33 范围 内 , P<0.05, 按 a=0.05 水 准 
拒绝 色 , 即 白斑 部 位 与 正常 部 位 的 白介素 水 平 有 显著 差异 。 

需要 注意 : 当 n>50 时 ,无 法 查 表 , 可 利用 秩 和 分 布 的 近似 正 态 法 进行 检验 。 已 知 在 原 假设 





| 辆 成 立时 ,近似 地 有 


T—nln+D/4|—0.5 
人 (10-1) 
其 中 0.5 为 连续 性 校正 数 ,z 近似 服从 标准 正 态 分 布 。 
当 相 同 秩 次 较 多 时 , z 值 偏 小 , 应 采用 校正 公式 , 即 
[IT—-nn+D/4|-—0.5 
ee DB) (10-2) 
24 48 
其 中 为 第 7 个 相同 秩 次 ( 即 平均 秩 次 ) 的 个 数 , 假定 有 2 个 秩 次 为 2.5, 4 个 秩 次 为 8.5, 则 =2， 
b=4, 故 有 














DB + -= D+(4 -4=66 
例 10-2 指导 28 名 有 轻 度 牙 周 疾病 的 成 年 人 进行 良好 的 口腔 卫生 保健 ,6 个 月 后 , 按照 牙 
周 情况 好 转 高 低 程度 分 别 给 予 +3、+2、+1; 牙 周 情况 变 差 程度 依次 给 予 分 数 -1, -2, -3; 没有 
变化 给 予 0 分。 数据 如 表 10-2 所 示 , 试 对 此 项 干预 的 结果 进行 评价 。 


表 10-2 实行 良好 口腔 卫生 习惯 6 个 月 后 牙 周 情况 的 变化 程度 











变化 分 数 人 数 | 变化 分 数 人 数 
3 4 = 4 
+2 洒 = 
+1 6 = 2 

0 5 | 








(1) 建立 检验 假设 ,确定 检验 水 准 

HU: Mu=0, 即 前 后 变化 分 数 的 总 体 中 位 数 为 零 

到: Msz#0, 即 前 后 变化 分 数 的 总 体 中 位 数 不 为 堆 

a=0.05 

〈2) 计算 7 统计 量 

记 变 化 分 数 的 绝 度 值 为 d, 编 秩 及 计算 正 负 秩 和 结果 如 表 10-3 所 示 。 


表 10-3 ”实行 良好 口腔 卫生 习惯 6 个 月 后 牙 周 情况 的 变化 程度 














频数 
9 = 总 和 秩 次 范围 ”平均 秩 次 负 秩 和 正 秩 和 
ER TO (5) (6) (7)=(2)x(6) (8)=(3)x(6) 
4 “6 10 1~10 CE a 
2 2 § 7 11~17 14 28 70 
3 用 4 6 18~23 20.5 4 82 





合计 入 二 23 二 = T=91 T=185 
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(3) 确 定 P 值 ,做 出 推断 

查 了 界 值 表 ( 附 表 8), To0scwyy=73~203, T=T.=91>73, 7 统计 量 值 落 在 上 下 界 值 之 间 , P>0.05， 
按 a=0.05 水 准 , 不 拒绝 所 , 即 对 有 轻 度 牙 周 疾 病 的 成 年 人 , 实行 良好 的 口腔 卫生 6 个 月 后 , 尚 
不 能 说 明 此 项 干预 对 牙 周 改善 有 显著 效果 。 

本 例 若 用 近似 正 态 法 计算 , 由 于 上 述 资料 相同 秩 次 较 多 , 用 校正 公式 (10-2) 得 出 


2 [IT—-nn+D/4|-0.5 
n+DCn+D Zt) 
24 48 
|91-23(23+1D/4|-0.05 
由 Gd0-10+ 人 -7D+(G 一 6) 
24 48 





Zz 











=1.44 


查 z 界 值 表 zo0sp=1.96, 本 例 中 z.<1.96,P>0.05, 按 a=0.05 的 检验 水 准 ,不 拒绝 友 , 结论 
同 前 。 


二 节 ”两 独立 样本 比较 的 秩 和 检验 


对 于 计量 资料 , 如 果 两 个 样本 分 别 来 自 方差 相等 的 正 态 分 布 总 体 的 假设 成 立 , 则 可 以 使 用 
1 检验 比较 两 样本 均 数 的 差别 是 否 具 有 统计 学 意义 ; 否则 采用 非 参 数 秩 和 检验 更 为 合适 。 本 节 
介绍 Wilcoxon 秩 和 检验 (Wilcoxon rank sum test), 其 目的 是 比较 两 样本 分 别 代表 的 总 体 分 布 位 置 
有 无 差异 。 





一 . 查 表 法 
例 10-3 ”观察 有 无 淋巴 细胞 转移 的 胃癌 患者 的 生存 时 间 ( 见 表 10-4), 问 两 组 患者 的 生存 时 
间 是 否 不 同 ? 


表 10-4 ”两 组 胃癌 患者 的 生存 时 间 ( 月 ) 














无 淋巴 细胞 转移 有 淋巴 细胞 转移 
时 间 秩 次 时 间 秩 次 
12 4.5 5 和 
25 10 8 2 
了 11 1 4.5 
29 12.5 12 4.5 
38 17 12 4.5 
42 19 17 2 
46 20 21 8 
46 21 24 9 
56 > 29 到 .5 
60 24 30 14 
34 15 
36 16 
40 18 
48 22 





m=10 T=162 m=14 T=138 











(人 
总 
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(1) 建立 检验 假设 , 确定 检验 水 准 

Ho: 有 无 淋巴 细胞 转移 患者 生存 时 间 的 总 体 分 布 位置 相 同 

到 :有 无 淋巴 细胞 转移 患者 生存 时 间 的 总 体 分 布 位 置 不 同 

a=0.05 

(2) 确定 秩 和 检验 统计 量 了 

首先 编 秩 号 , 即将 两 样本 24 个 数据 由 小 到 大 统一 编 秩 , 结果 见 表 10-4。 排 序 时 若 有 相同 数 
据 , 取 平均 秩 次 。 本 例 中 两 组 有 相同 的 观察 值 12 与 29, 原 秩 次 分 别 应 为 3、4、5、6 与 12、13, 所 
以 取 平均 秩 次 分 别 为 4.5 和 12.5。 进 而 , 将 两 组 数据 的 秩 次 分 别 求 和 , 若 两 组 例 数 相同 , 则 任 取 
一 组 的 秩 和 作为 统计 量 ; 若 两 组 例 数 不 同 , 则 以 例 数 较 小 者 对 应 的 秩 和 作为 统计 量 。 本 例 中 两 
组 例 数 分 别 10、14, 取 较 小 者 为 n,=10, T=7,=162。 

(3) 确 定 P 值 ,作出 推断 结论 

当 mm<10, n, 一 m<10 时 , 查 两 样本 比较 的 了 界 值 表 ( 附 表 9), 先 从 表 的 左 侧 查 m1( 两 样本 量 
较 小 者 ), 本 例 为 10; 再 从 表 上 方 找 到 两 样本 量 的 差 (n, 一 m1), 本 例 mn 一 m1=4, 两 者 交叉 处 即 为 了 
的 临界 值 。 将 检验 统计 量 7 了 值 与 了 的 临界 值 作 比较 , 如 果 7 了 在 界 值 范 围 内 , 则 P 值 大 于 表 上 方 
的 概率 值 ; 若 了 等 于 界 值 或 在 界 值 范围 外 , 则 PP 值 等 于 或 小 于 表 上 方 的 概率 值 。 本 例 了 的 双 侧 
临界 值 范围 为 91~159, 检验 统计 量 了 值 为 162, 超出 范围 , P<0.05, 拒绝 ,说明 有 无 淋巴 细胞 
转移 的 胃癌 患者 总 体 平均 生存 时 间 不 同 , 无 转移 组 生存 时 间 相 对 更 长 。 


二 、 正 态 近 似 法 
自 定 mn.<n,, 如 果 n, 和 一 m1 超出 7 界 值 表 的 范围 , 可 按 正 态 近 似 检验 ， 检验 公式 为 
a IT—-nN+D/2|-0.5 





























10-3 
Mmm N+D/12 b 9 
其 中 N=ni+nm, 统 计量 z 近 似 服从 标准 正 态 分 布 。 
当 相同 秩 次 较 多 时 (尤其 等 级 资料 ), 采用 下 面 校正 公式 
IT—mN+D/2|-0.5 
多 一 (10-4) 


(es —N- DC -1)] 


12N(N-—D 


其 中 尽 为 相同 秩 次 的 个 数 ,计算 方法 如 前 。 

上 述 公式 的 基本 思想 是 : 如 果 所 成立, 由 于 抽样 误差 的 存在 , 统计 量 7 与 总 体 的 平均 秩 和 
m(N+1)/2 应 该 相差 不 大 ; 当 7 与 n(N+1)/2 相差 太 大 时 , 超过 了 抽样 误差 可 以 解释 的 范围 ， 
则 有 理由 怀疑 所 的 正确 性 , 从 而 拒绝 。 

例 10-4 ”44 名 健康 人 与 24 名 慢性 气管 炎 病 人 疾 液 叶酸 性 粒 细胞 数 的 测量 结果 如 表 10-5 所 
示 , 问 健康 人 与 慢性 气管 炎 病 人 痰 液 中 嗜 酸性 粒 细胞 数 有 无 差别 ? 


表 10-5 ”两 组 人 痰 嗜 酸性 粒 细胞 的 秩 和 计算 














嗜 酸性 粒 细胞 数 健康 人 病人 秩 次 范围 平均 秩 次 例 数 较 小 组 的 秩 和 
(ya (3) (4) O(a 
3 11 和 ea 
了 at 区 305.0 
和 3 45-63 54 162.0 
§ 0 64-68 66 ey 
ee se A Ti=560.5 
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(1) 建立 检验 假设 , 确定 检验 水 准 

本 : 健康 人 慢性 气管 炎 病 人 痰 液 嗜 酸性 粒 细胞 数 的 测量 结果 总 体 分 布 位 置 相同 

到 : 健康 人 慢性 气管 炎 病 人 痰 液 嗜 酸性 粒 细胞 数 的 测量 结果 总 体 分 布 位 置 不 同 

a=0.05 

(2) 计算 检验 统计 量 

表 10-5 中 第 (4) 列 按 第 (2) 与 (3 ) 列 数据 统一 编 秩 号 ,第 (5) 列 为 各 等 级 的 平均 秩 次 ,第 (6) 
列 则 是 较 小 样本 的 秩 和 , 本 例 中 T=7,=560.5, 将 其 带 入 公式 (10-4) 得 出 ， 

[T,—nmN+D/2|-0.5 


m2 NN- Ye-D] 








12N(N -DD 
|560.5—24x(68+1)/2|-0.5 
— 24*44 [G8_68_ (6-16+28 -28+19—19+5;—5)] 
12x 68x (68—1) 
=3.62 


由 于 z=3.62>z00sp=1.96, P<0.05, 则 按照 a=0.05 检验 水 准 拒绝 防 , 认为 健康 人 与 慢性 气 
管 炎 病 人 痰 液 嗜 酸性 粒 细胞 数 的 测量 结果 总 体 分 布 位 置 不 同 。 


第 三 节 ”多 个 独立 样本 比较 的 秩 和 检验 


多 组 计量 资料 比较 时 , 若 数据 不 满足 方差 分 析 的 条 件 时 , 可 以 使 用 本 节 介 绍 的 Kmuskal-Wallis 
检验 (Kruskal-Wallis test), 又 称 为 K-W 检验 或 妃 检 验 , 这 种 方法 主要 用 于 推断 多 个 计量 资料 或 
多 组 有 序 资料 的 总 体 分 布 位 置 有 无 差别 。 

例 10-5 “为 研究 霍乱 菌 苗 不 同 途径 的 免疫 效果 , 对 不 同 途径 免疫 21 天 后 血清 抗体 滴 度 水 
平 进 行 了 测定 , 问 各 组 间 的 血清 抗体 滴 度 水 平 之 间 是 否 存在 差异 ? 


表 10-6 ”不同 途 径 免疫 21 天 后 血清 抗体 滴 度 的 分 布 与 秩 和 计算 

















气 雾 组 ( 亿 /ml) 秩 和 

抗体 滴 度 80 100 ”皮下 注射 组 ”合计 ”平均 秩 次 80 100 皮下 
(tA ) (2) (3) (4) (5) (6) (7) (8) (9) 
1:10 区 4 4 8 4.5 9 18 y 
1:20 15 3 1 31 20 300 140 20 
1:40 10 记 13 66 49 490 588 637 
1:80 5 7 9 87 77 385 539 693 
1:160 1 2 95 91.5 91.5 183 457.5 
1:320 一 一 1 96 96 一 96 
合计 33 32 31 一 1275.5 1468 1912.5 





(1) 建立 检验 假设 , 确定 检验 水 准 

印 : 三 组 血清 抗体 滴 度 水 平 的 总 体 分 布 位 置 相同 

到 : 三 组 血清 抗体 滴 度 水 平 的 总 体 分 布 位 置 不 全 相同 

a=0.05 

(2) 计算 检验 统计 量 瓦 

首先 将 各 组 数据 统一 按 从 小 到 大 顺序 编 秩 , 如 有 相等 数值 则 取 平 均 秩 次 ; 然后 分 别 计算 各 
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组 的 秩 和 RR; 最 后 计算 检验 统计 量 及 , 即 


H= 12 
NN+D 





R? 
2 D (10-5) 


其 中 入 =m +ns+…+ni 为 各 组 例 数 之 和 。 本 例 N=96, R1=1275.5, R,=1468, Rs=1912.5, 由 此 
得 到 


2 
2 FE-3N+D 








NN+D On 

2 2 2 
2 
96xC96+D) (| 33 32 31 


本 例 相 同 秩 次 较 多 , 使 用 校正 公式 更 加 准确 , 即 
H 


娓 = 一 二 一 一 一 


六 人 = 动 (10-6) 
1 7 


其 中 为 第 7 个 相同 秩 次 ( 即 平均 秩 次 ) 的 个 数 。 本 例 有 


11.36 
HO 12.27 
“ 1 8 -8+23 -23+35 -35+21 -21+8'—8 


96 一 96 








(3) 确定 己 值 做 出 推断 结论 

当 组 数 上 =3 且 每 组 例 数 ms5 时 , 可 查 互 界 值 表 ( 附 表 10) 得 到 P 值 ; 当 k>3 或 k=3 且 最 小 
样本 例 数 h>5 时 ,万 近 似 地 服从 自由 度 为 v=k 一 1 的 多 分布 ,可 查 必 界 值 表 得 到 卫 值 。 

本 例 k=3 且 最 小 样本 例 数 n>5, 查 儿 界 值 表 , v=k-1=3-1=2,X%o02=9.21, Hc=12.27> 
Xiotw, P<0.01, 拒 绝 本 ,三 组 血清 抗体 滴 度 水 平 的 差别 具有 统计 学 意义 。 











练习 题 
一 、 单 项 选择 题 
1. 对 医学 计量 资料 成 组 比较 ,相对 参数 检验 来 说 , 非 参数 秩 和 检验 的 优点 是 ( ) 
| A. 适用 范围 广 B. 检验 效能 高 
C. 检验 结果 更 准确 D. 充分 利用 资料 信息 
E. 不 易 出 现 假 阴性 错误 
| 2. 对 于 计量 资料 的 比较 , 在 满足 参数 法 条 件 下 用 非 参 方法 分 析 , 可 能 产生 的 结果 是 (  ) 
A. 增加 工 类 错误 B. 增加 开 类 错误 
C. 减少 I 类 错误 D. 减少 了 [类 错误 


E. 两 类 错误 都 增加 
3. 两 样本 比较 的 秩 和 检验 , 如果 样本 含量 一 定 ， 两 组 秩 和 的 差别 越 大 说 明 ( “) 


A. 两 总 体 的 差别 越 大 B. 两 总 体 的 差别 越 小 
C. 两 样本 的 差别 可 能 越 大 D. 越 有 理由 说 明 两 总 体 有 差别 





E. 越 有 理由 说 明 两 总 体 无 差别 








1 





4 多 个 计 各 资料 


A. 方差 分 析 


的 比 帮 





C. Kruskal-Wallis 及 检验 
E. 列 联 表 + 





5. 两 组 数据 的 秩 和 # 
A. 计算 简便 





险 和 1 检 3 





E. 对 数据 分 布 不 做 限制 
两 样本 比较 的 秩 和 检 
A. 例 数 较 小 的 秩 和 
C. 较 小 的 秩 和 
E. 任意 一 组 数据 的 秩 和 
7. 两 样本 比 # 
A. 两 样本 有 相同 的 秩 和 
C. 两 样本 分 布 相同 
E. 两 总 体 分 布 的 位 


站 











置 相同 
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, 当 分 布 类 型 未 知 时 , 应 选择 的 统计 方法 是 ( ) 


B. Wilcoxon 了 检验 
D. z 检 验 


验 相 比 , 其 优点 是 ( ) 


B. 检验 假设 合理 
D. 抽样 误差 更 小 


全 ,其 检验 统计 量 T 是 (。 ) 


B. 例 数 较 大 的 秩 和 
D. 较 大 的 秩 和 


9 秩 和 检验 , 其 无 效 假设 是 ( ) 


B. 两 总 体 有 相同 的 秩 和 
D. 两 总 体 分 布 相同 


8. 两 样本 比较 的 Wilcoxon 秩 和 检验 结果 显著 , 判断 熟 优 熟 劣 的 根据 是 ( ) 


A. 两 样本 的 秩 和 大 小 
C. 检验 统计 昔 了 值 大 小 
E. 两 样本 平均 秩 的 大 小 


B. P 值 大 小 
D. 两 样本 秩 和 的 差别 大 小 


9. 在 一 项 临床 试验 研究 中 , 疗效 分 为 “ 疼 念 、 显 效 、 有效 、 无 效 " 四 个 等 级 , 现 欲 比较 试验 组 


与 对 照 组 治疗 效果 有 无 差别 
A. Wilcoxon 秩 和 检验 

C. 四 格 表 入 检 
E. 计算 标准 化 率 





, 宜 采 用 的 统计 方法 是 (。 ) 
B. 2x4 列 联 表 多 检验 
DD. Fisher 确切 概 六 法 


10. 两 样本 比较 的 秩 和 检验 中 , 甲 组 中 最 小 数据 有 2 个 0.2, 乙 组 中 最 小 数据 有 3 个 0.2, 则 
数据 0.2 对 应 的 秩 次 是 ( ) 
A. 0.2 B. 10 
C. 5.0 D: 25 
E. 3.0 
二 、 计 算 与 分 析 








1. 茶 医院 测定 10 名 受 试 者 针 刺 肪 中 穴 前 后 痛 闽 的 数据 , 见 下 表 , 试 分 析 针 刺 脑 中 穴 
前 后 痛 阅 值 的 差异 有 无 统计 学 意义 ? 


10 名 受 试 者 针 刺 及 中 穴 前 后 痛 阅 资料 











针 刺 前 针 刺 后 针 刺 前 
1 600 610 6 1125 1425 
2 600 700 7 1400 1350 
3 685 575 8 750 825 
4 1050 600 9 1000 800 
5 900 600 10 1500 1400 














笔记 
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肠 溶 醋酸 棉 琴 片 前 后 的 精液 中 精子 浓度 检查 乡 
棉 酚 片 后 精液 中 精子 浓度 有 无 下 降 ? 


2. 8 名 健康 男子 服用 
间 3 个 月 ), 问 服用 肠 溶 醋 酸 





8 名 健康 男子 服用 肠 溶 醋酸 棉 酚 片 前 后 的 精液 中 精子 浓度 ( 万 /ml) 


告 果 如 下 表 ( 服 用 时 



















编号 服药 前 服药 后 | 编号 服药 前 服药 后 
1 6000 660 E; 6000 6300 
2 22000 5600 6 6500 1200 
3 5900 3700 26000 1800 
4400 5000 8 5800 2200 





维 以 高 蛋白 和 低 蛋 和 白 的 饲料 , 实验 时 间 自 生 后 28 天 至 84 天 止 , 计 8 
周 。 观 察 各 鼠 所 增 体重 , 结果 如 下 表 , 问 两 种 饲料 对 肉 鼠 体重 增加 有 无 显著 影响 ? 


3. 雌 鼠 两 组 分 别 给 


高 蛋白 和 低 蛋 白 两 种 饲料 雌 鼠 体重 增加 量 (g) 





高 蛋白 组 低 蛋 白 组 高 蛋白 组 低 蛋 白 组 
83 65 123 101 
97 70 124 107 
104 70 129 122 
| 107 78 134 
113 85 146 
119 94 161 











| | 4. 测 得 铅 作 业 与 非 铅 作业 工人 的 血 铝 值 (hg/100g), 见 下 表 , 问 铅 作业 工人 的 血 铅 值 


是 否 高 于 非 铝 作业 工人 ? 


铅 作 业 与 非 铅 作业 工人 的 血 铅 含量 (hg/100g ) 





笔记 














非 铝 作业 组 铝 作业 组 | 非 名 作业 组 铅 作 业 组 
5 17 12 43 
5 18: EE 44 
6 20 15 
7 25 18 
9 34 21 
5. 用 维生素 K, 眼 药水 对 近视 眼 串 者 作 治疗 , 对 照 组 用 二 二 爸 剂 ,对 两 组 的 





寻 交 


疗效 进行 观 


结果 如 下 表 , 试 





分 析 维 生 素 KK; 眼 药水 对 近视 上 腿 患 患者 的 治 


是 否 有 疗效 ? 














维生素 Ks 眼 药水 治疗 近视 眼 患 者 的 疗效 观察 
组 别 例 数 a 
恢复 进步 不 变 变 差 
维生素 K; 眼 药水 组 116 4 11 93 8 
生理 盐水 组 91 1 10 60 20 
合计 207 5 21 153 28 
6. 对 正常 、 单 纯 性 肥胖 及 皮质 醇 增 多 症 三 组 人 的 血浆 皮质 酵 含 量 进行 测定 ,其 结果 见 


下 表 ， 


问 三 组 人 的 血浆 皮质 酵 





差异 有 无 统计 学 意义 ? 
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三 组 人 的 血浆 皮质 酝 测 定 值 (nmolL) 
正常 单纯 性 肥胖 ”皮质 酵 增多 症 | ”正常 。” ”单纯 性 肥胖 皮质 醇 增多 症 














04 0.6 98 3.1 4.1 14.8 
1.9 1.2 102 3.7 5.0 15.6 | 
pl) 2.0 10.6 39 59 15.6 

2.5 24 13.0 4.6 7.4 21.6 | 
2.8 3.1 14.0 7.0 13.6 24.0 | 





7. 在 针 刺 麻醉 下 , 对 肺癌 、 肺 化 肤 症 及 肺结核 三 组 患者 进行 肺 部 手术 , 效果 分 四 级 ， 
结果 见 下 表 , 试 比较 针 刺 麻醉 对 三 组 病人 的 效果 有 无 差异 ? 











三 组 患者 肺 部 手术 的 针 麻 效果 | 
站 针 麻 效果 
组 别 例 数 于 N | 
肺癌 50 10 17 19 4 | 
肺 化 胺 105 24 41 et! 第 
肺结核 157 48 65 36 8 
合计 312 82 123 88 19 











( 刘 启 贵 ) 








人 
es 
名 


如 
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前 面 的 章节 中 介绍 的 均 为 单 变量 资料 的 统计 分 析 方 法 , 如 描述 某 一 变量 的 统计 特征 或 是 对 
各 组 间 的 差别 进行 比较 。 但 在 实际 的 医学 研究 中 , 常常 需要 对 两 个 变量 之 间 的 关系 进行 分 析 ， 
例如 年 龄 与 血压 、 糖 尿 病 患者 的 血糖 与 胰岛 素 水 平 、 孕 妇 的 雌 三 醇 水 平 与 新 生 儿 体重 之 间 的 关 
系 等 。 研 究 两 个 变量 之 间 的 关系 , 常用 的 统计 分 析 方法 是 线性 回归 与 相关 。 


第 一 节 线性 回归 


一 、 线 性 岂 归 的 慨 盒 


假设 有 两 个 变量 蕊 和 也 当 一 个 变量 改变 时 , 另 一 个 变量 了 也 相应 地 改变 , 此 时 称 克 为 
自 变 量 (independent variable ), 了 为 应 变量 (dependent variable )。 在 医学 和 生物 学 现象 中 ,很 
多 情况 了 与 在 数量 上 可 能 存在 线性 关系 , 如 在 研究 儿童 的 年 龄 与 体重 的 关系 时 , 一 般 来 说 
儿童 的 年 龄 越 大 其 体重 亦 越 重 。 对 此 , 可 以 用 一 个 直线 方程 来 描述 两 个 变量 间 依 存 变化 的 数 
量 关系 , 这 样 得 出 的 直线 方程 叫做 线性 回归 方程 (linear regression equation )。 线 性 回归 方程 的 





形式 为 


YF=at+by (11=1) 


其 中 ， 了 是 给 定 卫 时 了 的 估计 值 ; a 为 截 距 (intercept ) 或 常数 项 (constant term ), 为 回归 系数 
(regression coefficient), 通过 样本 数据 计算 得 到 。 计 算 公 式 : 











名 C32.910%9, 
1 To-BYr-D 之 好 -全 
这 TR (EX) 人 
2 
a=Y-bX (11-3) 


| 式 (11-2) 和 式 (11-3) 中 ,jn 表示 大 与 了 的 离 均 差 各 和 , lw 表示 的 离 均 差 平方 和 ;XX 和 了 分 别 


为 两 个 变量 的 均值 。 

回归 系数 b 和 常数 项 a 是 方程 中 两 个 待定 的 参数 , 计算 这 两 个 参数 的 数学 原理 是 最 小 二 乘 
法 (method of least squares ), 该 方法 的 原则 是 保证 各 实测 点 到 回归 直线 的 纵向 距离 的 平方 和 最 小 ， 
并 使 计算 出 的 回归 直线 最 能 代表 实测 数据 所 反映 出 的 直线 趋势 , 即 0= 如 0 一 六 ?最 小 。 上 述 
计算 公式 就 是 依据 最 小 二 乘法 推导 出 的 结果 。 

-、 回 归 方 程 的 估计 

例 11-1 研究 饮水 氟 含 量 与 成 人 骨 X 线 改变 指数 间 的 关系 , 得 到 了 表 11-1 中 所 示 的 资料 ， 
试 进行 回归 分 析 。 

(1) 根据 表 11-1 的 数据 绘制 散 点 图 (图 11-1)。 从 绘制 的 散 点 图 中 可 以 看 出 饮水 氟 含 量 与 成 
人 上 骨 义 线 改变 指数 之 间 存 在 着 明显 的 直线 趋势 , 所 以 可 以 进一步 考虑 建立 二 者 之 间 的 线性 回归 
方程 。 
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表 11-1 饮水 氟 含 量 ( mg/L ) 与 骨 X 线 改变 指数 回归 分 析 数 据 











调查 对 象 ” ”饮水 氟 含 量 (X) 。 骨 X 线 改变 指数 (Y) XY Xx? VE 
1 0.24 0.40 0.10 0.06 0.16 
2 0.80 0.56 0.45 0.64 0.31 
有 1.00 1.91 1.91 1.00 3.65 
4 1.80 0.86 1.55 3.24 0.74 
六 Sla 5.25 16.38 9.73 27.56 
6 4.10 3.40 13.94 16.81 11.56 
7 5.60 58.38 326.93 31.36 3408.22 
8 10.27 70.33 722.29 105.47 4946.31 
9 10.81 116.30 1257.20 116.86 13525.69 
合计 37.74 257.39 2340.75 285.17 21924.20 





骨 X 线 改变 指数 











图 11-1 饮水 气 含量 与 成 人 骨 X 线 改变 指数 之 间 关系 散 点 图 
(2) 计算 回归 系数 与 常数 项 
本 例 : 2 站 =37.74, DX?=285.17, 六 =4.19 
7= 257.39, DY? = 21924.20, 了 = 28.60 
DXY =2340.75 
代入 式 (11-2) 和 式 (11-3) 得 





DDO) 37.74x257.39 
DAY-- 人 2340.75 -一 人 2 人 
a n 9 1261.43 
0 Ds WF 20091 
”Tx (2X) 285.17 -2 : 
n 
a=Y-bX=28.60—9.940x4.19=-13.049 
则 回归 方程 为 
?=—13.049+9.94X 
(3) 作 回归 直线 


按 上 述 回归 方程 , 在 X 实 测 值 的 范围 内 , 任 取 两 个 相距 较 远 的 点 4( 铸 , 背 ) 和 B( 态 , 竣 ), 连 
接 A、B 两 点 即 得 到 回归 直线 。 本 例 可 取 多 =2, 计算 出 六 =6.83; 区 = 10.5, 计算 出 名 =91.32; 两 
点 的 连 线 即 为 所 求 回归 直线 (参见 图 11-1)。 
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由 图 可 见 , 饮水 氟 含 量 升 高 , 成 人 的 骨 X 线 改 变 指数 也 趋向 升 高 , 骨 X 线 改 变 指数 了 随 饮 
水 氟 含 量 艺 的 变化 而 变化 , 散 点 呈 直 线 趋势 , 但 并 不 完全 在 一 条 直线 上 , 说 明 除 了 受 自 变量 的 
影响 外 , 还 有 其 他 因素 对 了 起 作用 。 


三 、 线 性 回归 的 假设 检验 


由 样本 资料 计算 的 回归 系数 b 和 其 他 统计 量 一 样 ,存在 抽样 误差 , 即使 总 体 回归 系数 p=0， 
由 样本 资料 计算 的 回归 系数 5b 也 不 可 能 恰好 等 于 0。 因 此 ,需要 对 线性 回归 方程 进行 假设 检验 。 

(一 ) 方差 分 析 

7 值 的 变异 可 用 》 (Y -了 六? 来 反映 , 而 每 个 z- 了 都 可 以 分 解 为 





Y-Y=(Y-PD+(?-7) 
经 推导 得 
To- =TG-P + -7 (11-4) 
式 中 , 多- 芒 ? 为 了 的 离 均 差 平方 和 , 表示 应 变量 了 的 总 变异 ,用 SSg 表 示 ; > ,CY 了)? 称 回 
归 平方 和 , 表示 在 了 的 总 变异 中 , 可 以 用 了 与 了 的 线性 关系 解释 的 那 部 分 变异 ,用 SSmn 表 示 ; 
C7- 六 ? 称 剩余 平方 和 或 残 差 平方 和 ,用 于 说 明 除了 针对 了 的 线性 影响 之 外 的 其 他 随机 因素 
对 了 的 变异 的 影响 ,用 SSxx 表 示 。 用 公式 表示 有 
SS 一 SS 十 SS9 关 (11-5) 
回归 方程 检验 的 基本 思想 : 如 果 久 与 了 之 间 无 线性 回归 关系 , 则 SSmm 与 SS 都 只 包含 随 
机 因素 对 了 的 影响 , 因此 其 均 方 MSan 与 MSa# 应 近似 相等 , 如 果 两 者 差别 较 大 , 并 超出 能 够 
用 随机 波动 解释 的 程度 , 则 认为 回归 方程 具有 统计 学 意义 。 对 此 , 可 用 方差 分 析 方法 对 其 进 
行 检验 。 
回归 系数 的 假设 检验 可 用 下 面 的 简化 公式 计算 , 即 














2 
二 7 
sss -F077 -Tr (11-6) 
Ps 2 
SSam = bly = 一 全 =) lw (11-7) 
Lx 
SSR¥= SS — 99 四 归 (11-8) 
三 个 平方 和 对 应 的 自由 度 依次 为 vg=n 一 1, va=1, va=n 一 2; 相应 的 均 方 为 
MS i 9 回归 MS 语 Sex ( 11-9) 
| Ma 了 残 闪 
检验 统计 量 为 
AR (11-10) 
MS 


下 面 对 例 11-1 数据 建立 的 回归 方程 进行 假设 检验 : 
(1) 建立 假设 检验 , 确定 检验 水 准 

Ho: B=0 

万 :ptF0 

a=0.05 
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(2) 计算 统计 量 
ss = 了 PP- 世纪 -219242- 2 =14 563.13 
n 


8 126143 
中 


i = =12 538.06 
ww 126.91 





Boa —S9— Sp = 2025.07 


FF= AS _ SStau /vs _ 12538.06/1 -4334 
MMS SSnx/vax “2025.0717 
(3) 确 定 P 值 ,得 出 统计 结论 
查 已 界 值 表 ( 附 表 4), van= 1， VR 关 =7 Foo.7)=12.25, > Foma.7n), P<0.01, 拒绝 本 ， 可 以 
认为 饮水 气 含 量 与 成 人 骨 X 线 改变 指数 之 间 存 在 线性 回归 关系 。 上 面 结 果 可 以 归纳 成 表 11-2 
的 形式 。 




















表 11-2 方差 分 析 表 
变异 来 源 SS v MS a P 
总 变异 14563.13 8 
回归 12 538.06 1 12538.06 43.34 <0.01 
残 差 2025.07 289.30 
(二 ) i 检验 
回归 系数 检验 也 可 以 采用 1 检验 的 方法 , 即 
ee (11-11) 
Sp 
S, | 
$= (11-12) 
b vs 
SS ) 
Sy.x = 闪 [MSs (11-13 
了 残 关 


其 中 , 5, 为 样本 回归 系数 的 标准 误 , 反映 样本 回归 系数 的 抽样 误差 ; Srx 为 剩余 标准 差 , 表示 应 
变量 了 值 对 于 回归 直线 的 离散 程度 。 

例 11-1 数据 建立 回归 方程 后 , 进行 1 检验, 过程 如 下 : 

(1) 建立 假设 检验 , 确定 检验 水 准 











Ho: B=0 
Hi:PB#O0 
a=0.05 
(2) 计 算 统计 量 
2025.07 17.01 
a =17.01, 5, = =1.510 
7 ” Vi26.91 
9.940) 58 =9-2=7 
1.51 
〈3) 确定 已 值 , 作出 结论 


根据 v=7, 查 1 界 值 表 ( 附 表 2), towww=3.499, P<0.01, 拒绝 国 , 结 论 与 检验 相同 。 可 以 
看 出 ,统计 量 玉 与 1 之 间 存 在 确定 的 数量 关系 , 即 VF =1, 本 例 V43.34 = 6.58。 


.4 


[es 
[ea 
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二 节 线性 相关 
一 、 线 性 相关 的 概念 


对 两 变量 关系 的 研究 , 有 时 并 不 要 求 由 了 估计 了 Y, 而 关心 的 是 两 个 变量 之 间 是 否 具有 直线 
相关 关系 。 例 如 11 名 男 青年 身高 与 前 臂 长 资料 绘制 的 散 点 图 如 图 11-2 所 示 , 为 直观 地 描述 两 
个 变量 之 间 的 关系 , 可 以 绘制 散 点 图 。 由 图 可 以 看 出 , 男 青年 身高 与 前 臂 长 散 点 呈 直 线 趋势 ， 
即 男 青年 身材 高 , 前 臂 亦 长 , 说 明 身 高 与 前 臂 长 之 间 存 在 线性 相关 关系 , 这 种 关系 称 为 直线 相 
关 (linear correlation ) 或 简单 相关 (simple correlation )。 





52 
50 下 
© 
48 
定 © © © 
% l 
EE 
44 日 e 
© 
42 2 
© 
40 人 2 
150 160 170 180 190 
身高 (em) 


图 11-2 11 名 男 青年 身高 与 前 臂 长 散 点 图 


直线 相关 用 于 分 析 双 变量 正 态 分 布 (bivariate normal distribution ) 资 料 。 直 线 相关 的 性 质 可 


由 散 点 图 直观 地 说 明 , 具体 可 分 为 以 下 几 种 情况 : 
(1) 正 相 关 (positive correlation ): 如 图 11-3(1) 所 示 ， 各 点 的 分 布 呈 现 椭圆 形 ;了 的 取 值 随 X 


的 取 值 增加 而 增加 , 反之 亦 然 ; 散 点 的 分 布 越 集中 , 相关 越 密切 , 当 各 点 的 分 布 如 图 11-3(2) 完 


全 在 一 条 直线 上 时 ,与 7 呈 完 全 正 相 关 。 
(2) 负 相关 (negative correlation ): 如 图 11-3(3 )， 各 点 的 分 布 也 呈现 椭圆 形 , 7 了 的 取 值 随 X 的 


取 值 增加 而 减少 , 反之 亦 然 ; 散 点 的 分 布 越 集中 , 相关 越 密切 , 当 各 点 的 分 布 如 图 11-3(4) 完 全 
在 一 条 直线 上 时 , 则 XX 与 Y 呈 完全 负 相 关 。 


r=] 














(D 正 相关 (2) 完全 正 相关 G) 负 相关 他 完全 负 相关 
| 720 720 720 


图 11-3 ”直线 相关 示意 图 
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(3 ) 无 相关 (zero correlation ): 如 图 11-3 中 的 (5)(6)(7), 无论 了 增加 还 是 减少 ,了 不 受 其 影 
响 。 图 11-3 中 的 (6)、(7) 两 种 情形 , 虽然 各 点 分 布 接近 直线 , 但 直线 与 下 轴 或 了 轴 平 行 , 使 XX 与 
7Y 互 不 影响 , 呈 无 相关 。 

〈4) 非 线性 相关 : 如 图 11-3 中 的 (8), 散 点 分 布 显示 大 与 了 之 间 可 能 存在 某 种 曲线 相关 , 故 
称 为 非 线性 相关 , 这 不 属于 本 章 介绍 的 内 容 。 

在 医学 研究 中 , 完全 正 相关 或 完全 负 相关 的 情况 几乎 不 存在 。 线 性 相关 的 正 负 方 向 和 密切 
程度 可 以 用 相关 系数 进行 定量 描述 。 


`、 相 关系 数 及 其 计算 


相关 系数 (correlation coefficient ) 又 称 Pearson 积 差 相关 系数 (coefficient of product moment | 
correlation ), 是 说 明 具 有 直线 相关 关系 的 两 个 数值 变量 间 相 关 的 密切 程度 和 相关 方向 的 统计 | 


量 , 其 计算 公式 为 
ly D-DD 
Va KZ- 站 
式 中 , lwy 表 示 半 与 了 的 离 均 差 积 和 , lw 表示 XX 的 离 均 差 平方 和 , lyy 表示 了 的 离 均 差 平方 和 。 具 
体 计算 公式 为 





(11-14) 





1m -Ex-Do-D-yx -COE (11715) 
we = DX 元 )2 一 下 C2 (11-16) 
A Y= by bo (11-17) | 


将 上 述 各 式 的 计算 数值 代入 公式 (11-14) 中 ， 人 

相关 系数 + 没有 度量 衡 单位 , 其 取 值 范围 为 -1<r<1。x>0 表示 正 相关 ,r<0 表示 负 相 关 ， 
r=0 表示 无 相关 , 即 无 直线 关系 , 当 Irl= 1 时 为 完全 相关 。 相 关系 数 的 绝对 值 愈 接近 1, 相关 愈 
密切 ; 相关 系数 愈 接近 0, 相关 愈 不 密切 。 

例 11-2 从 男 青年 总 体 中 随机 抽取 11 名 男 青年 组 成 样本 , 分 别 测量 每 个 男 青年 的 身高 和 
前 臂 长 ,测量 结果 如 表 11-3 所 示 , 试 计算 身 高 与 前 臂 长 之 间 的 相关 系数 。 


表 11-3 11 名 男 青年 身高 与 前 臂 长 的 测量 结果 ( cm ) 








编号 身高 (X) 前 臂 长 (Y) XY X2 Y 
1 170 47 7990 28 900 2209 
2 173 42 7266 29929 1764 
3 160 44 7040 25 600 1936 
4 155 41 6355 24025 1681 
和 173 47 8131 29 929 2209 
6 188 50 9400 35344 2500 
4 178 47 8366 31684 2209 
8 183 46 8418 33 489 2116 
9 180 49 8820 32 400 2401 
10 165 43 7095 27225 1849 
11 166 44 7304 27556 1936 





合计 891 500 86185 326081 22810 





区 本 


[el 
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经 计算 : 
DX=1891, >,X* =326081 
DY=500, DY’ =22810 
,XY=86185, n=11 
代入 计算 公式 得 


2 
如 2 
Le = Fx -2 081— 1 =1000.909 


有 
Yr 2 
让 -C7 .» 810— =82.727 








Wr COD S6185— LEs 230:455 
n 11 


| 按 式 (11-14) 计 算 相关 系数 为 


六 230.455 
V1000.909 x 82.727 
由 计算 结果 可 见 , 本 例 为 正 值 , 表示 前 臂 长 与 身高 呈正 相关 关系 , 而 且 相 关 程度 较 高 。 


三 、 相 关系 数 的 假设 检验 
由 于 是 样本 统计 量 , 对 于 男 青年 的 身高 与 前 臂 长 之 间 的 相关 关系 , 尚 需 进行 假设 检验 , 即 
要 判断 两 个 变量 与 了 是 否 真 的 存在 相关 关系 ,为 此 需 根据 + 值 作 总 体 相关 系数 p 是 否 为 零 的 
假设 检验 。 对 此 可 以 用 1 检验 法 ,其 公式 为 
Ir-0 


1l~¥ 


=0.8009 





f= ,V=n—2 (11-18) 





2 





3 
1 
MD 


式 中 ,分 母 为 相关 系数 + 的 标准 误 。 求 得 1 值 后 查 附 表 2 得 到 了 值 ,然后 根据 P 值 的 大 小 决定 
是 否 拒绝 有。 为 简单 起 见 ,也 可 以 直接 根据 计算 出 的 r 值 , 查 r 界 值 表 ( 附 表 11) 得 到 P 值 , 若 
7> ran,v, 则 可 以 认为 两 变量 之 间 存在 线性 相关 关系 。 

下 面 对 例 11-2 计算 得 到 的 x 值 进 行 假设 检验 : 

(1) 建立 检验 假设 , 确定 检验 水 准 

Ho: p=0, 即 身高 与 前 臂 长 之 间 不 存在 线性 相关 关系 

HH: p 关 0, 即 身高 与 前 辟 长 之 间 存在 线性 相关 关系 


a=0.05 
(2) 计算 统计 量 
1=-|0.8009-0| -4013,v=11-2=9 
1 一 0.8009” 
1 


(3) 确 定 P 值 ,作出 结论 

查 1 界 值 表 ( 附 表 2), 得 ooosn.s=3.690,1> too0sp.9, P<0.005, 故 按 4=0.05 检验 水 准 , 拒绝 
古 ,接受 HH, 可 以 认为 男 青年 身高 与 前 辟 长 之 间 存 在 正 相 关 关系 。 或 直接 查 + 界 值 表 ( 附 表 11)， 
rooosp.9=0.776,r>rooosn.9，P<0.005, 结论 相同 。 
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第 三 节 ”线性 回归 与 相关 应 用 的 注意 事项 


一 、 回 归 分 析 的 应 用 


1. 线性 回归 方程 可 应 用 于 以 下 三 个 方面 :(1) 分 析 两 个 变量 之 间 是 否 存在 线性 依存 关系 ; 
(2) 利 用 回归 方程 由 自 变量 针对 应 变量 了 进行 估计 ,必要 时 可 以 作 区 间 估计 ;(3) 利 用 回归 方程 
进行 统计 控制 , 即 利用 回归 方程 进行 逆 运 算 , 通过 控制 自 变量 X 取 值 来 限定 应 变量 了 在 一 定 范 
围 内 波动 。 其 中 应 用 最 多 的 是 第 一 方面 。 

2. 作 回 归 分 析 时 , 如果 两 个 有 内 在 联系 的 变量 之 间 存在 因果 关系 ,那么 应 该 以 原因 变量 为 
和 以 结果 变量 为 内 如 果 变 其 之 间 因 果 关系 难以 确定 , 则 应 以 易于 测定 或 变异 较 小 者 为 X。 

3. 在 回归 分 析 中 , 自 变量 头 既 可 以 是 随机 变量 ( 称 为 I 型 回归 模型 , 两 个 变量 都 服从 正 态 分 
布 ), 也 可 以 是 给 定 的 量 ( 称 为 I 型 回归 模型 , 在 浆 取 值 固定 时 了 服从 正 态 分 布 )。 如 果 了 不 服从 
正 态 分 布 , 在 进行 回归 分 析 前 , 应 先进 行 变量 变换 , 从 而 使 应 变量 符合 回归 分 析 的 要 求 。 

4. 使 用 回归 方程 估计 了 值 时 , 尽量 不 要 把 估计 的 范围 扩大 到 建立 方程 时 自 变 量 的 取 值 范围 
之 外 , 由 于 超出 样本 取 值 范围 , 其 线性 关系 是 否 成 立 难以 判断 , 外 推 机 慎重。 如 例 11-1 中 ,的 
取 值 范围 为 0.24~10.81, 计算 估计 值 时 XX 的 取 值 最 好 在 0.24~10.81 之 间 。 


二 、 线 性 相关 分 析 的 应 用 


1. 相关 分 析 理 论 上 适用 于 两 个 变量 都 服从 正 态 分 布 的 情形 , 如 果 资 料 不 服从 正 态 分 布 ,应 
先 通过 变量 变换 , 使 之 近似 正 态 化 后 计算 其 相关 系数 。 如 果 不 能 正 态 化 , 或 针对 有 序数 据 则 可 
以 计算 Spearman 或 Kendall 相关 系数 进行 分 析 ( 人 参考 SPSS 软件 说 明 )。 

2. 相关 系数 + 值 究 竞 多 大 有 实际 意义 ,需要 根据 具体 问题 而 定 。 一 般 而 言 ,r<0.3 时 , 表示 
相关 性 较 差 ;0.3<r<0.6 时 ,表明 中 度 相关 ; 0.6<x<0.8 时 , 表示 有 较 高 度 的 相关 性 ; r>0.8 时 ， 
表明 有 很 高 的 相关 性 。 

3. 相关 系数 可 以 描述 两 个 变量 间 相互 关系 的 密切 程度 和 方向 。 然 而 , 不 能 因为 两 变量 间 
的 相关 系数 有 统计 学 意义 (P<a), 就 认为 两 者 之 间 存在 着 因果 关系 , 要 证 明 两 事物 间 确 实 存在 
因果 关系 , 必须 凭借 专业 知识 加 以 阐明 。 医 学 中 很 多 变量 的 数量 变化 都 可 能 是 由 于 相关 的 因子 
调控 引起 的 。 











三 、 线 性 回归 与 相关 的 区 别 
1. 相关 系数 的 计算 只 适用 于 两 个 数值 变量 都 服从 正 态 分 布 的 情形 , 而 在 回归 分 析 中 , 应 变 
量 是 随机 变量 , 自 变 量 既 可 以 是 随机 变量 ( [型 回归 模型 ), 也 可 以 是 给 定 的 量 (I 型 回归 模型 )。 
2. 线性 相关 表示 两 个 变量 之 间 的 相互 关系 是 双向 的 , 线性 回归 则 反映 两 个 变量 之 间 单 向 
的 依存 关系 , 更 适合 分 析 因 果 关 系 的 数量 变化 。 
四 、 线 性 回归 与 相关 的 联系 
1. 对 同一 资料 进行 相关 与 回归 分 析 , 相关 系数 x 与 回归 方程 中 的 5 正 负 号 相同 ,> 和 ,为 
正 ,说 明 X 与 7 的 数量 变化 的 方向 是 一 到 的,X 增 大 ,Y 也 增 大 ; 如 果 符 号 为 负 , 说 明 方向 相反 。 
2. 对 同一 样本 可 以 得 出 与 5 互相 转化 的 公式 , 两 种 假设 检验 完全 等 价 。 由 于 ,的 假设 检 
验 可 以 直接 查 表 , 较为 简单 ,所 以 也 可 以 用 其 代 兰 对 5 的 假设 检验 。 
3. 相关 与 回归 可 以 互相 解释 。r 的 平方 称 为 决定 系数 (coefficient of determination ), 可 表示 为 
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R? 表示 回归 平方 和 在 总 平方 和 中 所 占 的 比重 , 即 R? 越 接近 1, 回归 效果 越 好 。 应 用 沁 和 


线性 回归 与 相关 








Be Spa 1 
1 ry SS 





还 可 以 从 回归 的 角度 对 相关 系数 做 进一步 的 理解 ,例如 x=0.5, 有 R=0.25, 说 明 应 变 
有 25% 可 以 由 自 变量 所 解释 。 





练习 题 
一 、 单 项 选择 题 


A. 相关 系数 越 大 
C. 回归 系数 越 大 


[Ne 


A. 相关 系数 越 大 


A. 于 和 了 服从 双 变 量 
C. 了 服从 正 态 分 布 


丰 


A. 相关 系数 了 也 较 大 
C. 决定 系数 尼 较 大 


A. p=0 时 ,r=0 
C.r>0 时 ,b<0 
E. p<0 时 ,r>0 


A. 年 龄 与 体重 
C. 体重 与 体 表 面积 
EE. 工 岭 与 串 病 率 





ES i 闫 当 哆 二 


1. 两 数值 变量 的 相关 关系 越 强 , 对 应 的 是 ( 


E. 相关 系数 检验 统计 量 的 ! 值 越 大 
回归 分 析 的 决定 系数 民 越 接近 于 1, 说 明 ( 


C. 应 变量 的 变异 越 大 
E. 自 变量 对 应 变量 的 影响 越 大 
3. 对 两 变量 六 和 了 作 简单 线性 相关 分 析 , 要 求 的 条 件 是 (  ) 


正 态 分 布 


E. 七 和 了 至 少 有 一 个 服从 正 态 分 布 
两 组 资料 作 回归 分 析 , 直线 回归 系数 b 较 大 的 一 组 ,表示 ( 。 ) 


| E. 了 随 下 变化 其 数量 有 更 大 的 变化 
| 5. 1~7 岁 儿 童 可 以 用 年 龄 ( 岁 ) 估 计 体重 (市 斤 ), 回归 方程 为 了 =14+4X, 车 将 体重 换 成 国 


际 单位 kg, 则 此 方程 ( ) 
A. 常数 项 改变 
常数 项 和 回归 系数 都 改变 


) 


D. 有 有 活 数 和 信人 系 


B. 相关 系数 的 绝对 值 越 大 
D. 回归 系数 的 绝对 值 越 大 


) 
B. 回归 方程 的 显著 程度 越 高 
D. 应 变量 的 变异 越 小 


B. 天 服 从 正 态 分 布 
D. 了 和 了 有 回归 关系 


B. 假设 检验 的 已 值 较 小 
D. 决定 系数 尼 较 小 


B. 回归 系数 改变 
DD. 常数 项 和 回归 系数 都 不 改变 


6. 对 同一 资料 进行 线性 回归 与 相关 分 析 时 , 下列 正 确 的 情形 是 ( ) 


B. p>0 时 ,b>0 
D. r<0 时 ,b<0 


7. 下 列 双 变量 中 , 适用 于 进行 线性 相关 分 析 的 是 ( 。 ) 


B. 民族 与 血型 
D. 母亲 文化 水 平 与 子女 的 智商 


8. 若 直 线 回归 系数 的 假设 检验 结果 P<0.05, 则 可 认为 两 变量 间 (  ) 
| A. 有 密切 的 关系 


B. 有 一 定 的 因果 关系 
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E. 有 较 强 的 回归 关系 
9. 作 线 性 相关 分 析 时 , 当 n=12,r=0.767, 查 r 界 值 表 rooow2,10=0.823, ro0022,10 二 0.795， 
rooosr2,10 三 0.750, 则 忆 值 范围 为 (”) 
A. 0.001<P<0.002 B. P<0.001 
C. P<0.002 D. P>0.005 
E. 0.002< P<0.005 
10. 通过 线性 回归 分 析 (n=48), 得 决定 系数 民 =0.49, 则 下 列 说 法 中 错误 的 是 (。 ) 
A. 两 个 变量 具有 回归 关系 B. 一 定 有 相关 系数 +=0.70 
的 自由 度 v=46 D. 回归 平方 和 大 于 剩余 平方 和 
E. 了 的 总 变异 有 49% 可 以 由 六 的 变化 解释 
二 、 计 算 与 分 析 题 
1. 12 名 20 岁 女 青年 的 身高 与 体重 资料 如 下 表 , 试问 女 青年 身高 与 体重 之 间 有 无 相关 






12 名 20 岁 女 青年 的 身高 与 体重 资料 
编号 4 2 3 4 5 6 7f 8 9 10 4 12 











身高 (cm ) 164 156 172 172 177 180 166 162 172 167 158 152 
体重 (kg) 55 56 60 68 66 65 56 §5 60 55 46 51 





2. 某 医师 研究 某 种 代 乳 粉 价值 时 , 用 大 白鼠 做 实验 , 得 到 大 白鼠 进食 量 和 体重 增加 量 
的 资料 如 下 表 , 试问 大 白鼠 的 进食 量 与 体重 的 增加 量 之 间 有 无 关系 ? 能 否 用 大 白 饼 的 进 
食量 来 估计 其 体重 的 增加 量 ? 


大 白鼠 进食 量 和 体重 增加 量 的 资料 
动物 编号 2 3 4 § 6 7 G9 10 11 
进食 是 (g) 820 780 720 867 690 787 934 679 639 820 780 
增 重量 (g) 165 158 :30° ‘180 Msg S10 PIROm AW 200 "150 495 








3. 测 得 347 名 13 岁 健 康 男 童 的 身高 和 体重 , 身高 均 数 为 146.4cm, 标准 差 为 8.61cm， 
体重 均 数 为 37.04kg, 标准 差 为 6.67kg。 身 高 和 体重 的 相关 系数 /= 0.74, 试 计算 由 身高 推 
体重 的 回归 系数 及 由 体重 推 身高 的 回归 系数 。 

4. 茶 防 治 所 作 病 因 研 究 , 对 一 些 地 区 水 质 的 平均 矶 含量 (hg/LL) 与 地 方 性 甲状 腺 肿 患 
病 率 进行 了 调查 , 结果 如 下 表 , 试问 甲状 腺 肿 患 病 率 与 水 质 中 矶 的 含量 有 无 相关 关系 ? 


局 部 地 区 水 质 的 平均 碘 含量 ( hg 儿 ) 与 地 方 性 甲状 腺 肿 患 病 率 
地 区 编号 。 1 2.3 "4 ONG 7 OO DA 
患 病 率 (%) 40.5 37.7 39.0 20.0 22.5 37.4 31.5 15.6 21.0 63 7.1 90 40 5.4 
碘 含 量 (He/L) 10 20 25 35 35 40 44 45 46 77 80 80 83 8.5 











( 钱 联 ) 
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第 十 二 意 。 多 元 线性 回归 | 


在 第 十 一 章 中 已 介绍 了 用 直线 回归 描述 一 个 应 变量 与 一 个 自 变 量 之 间 的 线性 依存 关系 ,但 
由 于 事物 之 间 的 联系 往往 是 多 方面 的 , 特别 在 医学 研究 中 , 某 个 应 变量 往往 受 多 个 因素 ( 自 变 
量 ) 的 影响 , 如 儿童 身高 不 仅 受 年 龄 影响 , 而 且 受 性 别 影响 ; 肺活量 的 大 小 除 与 年 龄 ,性 别 有 关 
外 ,还 受 身高 、 体 重 以 及 胸围 的 呼吸 差 等 因素 的 影响 。 如 果 这 些 因素 与 应 变量 之 间 的 关系 是 线 
性 的 , 则 可 以 应 用 多 元 线性 回归 (multiple linear regression ) 来 研究 。 多 元 线性 回归 是 研究 一 个 应 
变量 与 多 个 自 变 量 之 间 线 性 依存 关系 的 统计 方法 , 可 以 对 自 变 量 的 作用 进行 评价 , 也 可 以 用 作 
预测 和 判别 。 
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一 、 多 元 线性 回归 方程 


设 与 应 变量 了 有 关 的 自 变量 有 m 个 , 记 为 名 ,名 ,…, Xo。 假定 观察 到 n 例 样本 数据 ,如 表 
12-1 所 示 。 


表 12-1 多 元 回归 分 析 数 据 格式 











例 号 ji > DG … Xn ¥ 
1 Xi Xl 寻 Xin 六 
yA D> J 本 A 
3 > > 5 Xsm 六 
n EN 人 Km 莉 
多 元 线性 回归 方程 可 写 为 
Y=b +bX +bY, + +b, XY, (12-1) 


式 中 ,了 为 在 自 变量 系 , 为 ,…,%, 时 ,应 变量 了 的 总 体 平均 值 的 估计 值 ; bo, 2， 5b。,…, pw 为 待定 
系数 。 其 中 bo 相当 于 一 元 直线 回归 方程 中 的 常数 项 a, 表示 当 所 有 自 变量 为 0 时 应 变量 了 的 总 
体 平 均值 的 估计 值 ; b)(j=1,2,…,m) 为 自 变量 为 的 偏 回 归 系 数 (partial regression coefficient )， 简 
称 回归 系数 , 表示 除 妆 以 外 的 其 他 自 变量 固定 不 变 的 情况 下 , 蕊 每 改变 一 个 测量 单位 所 引起 的 
应 变量 了 的 平均 改变 量 。 

与 直线 回归 相同 , 多 元 线性 回归 模型 的 参数 估计 可 以 用 最 小 二 乘法 得 到 , 即 根据 观察 到 的 
n 例 数据 ,代入 公式 (12-1), 得 到 残 差 平方 和 


Q= 2G = = PCb+ bX tb Xt +b, Xm)] (12-2) 
i=1 = 





然后 计算 出 使 O 最 小 的 5b1,b,,…,b。 常 数 项 bo 可 用 下 式 求 出 
b=Y-(BX + bX, + +b,X,) (12-3) 
由 于 多 元 线性 回归 方程 的 最 小 二 乘法 计算 量 较 大 , 需要 借助 统计 软件 完成 。 本 章 将 主要 通 
过 实例 介绍 多 元 线性 回归 分 析 的 基本 步骤 , 并 利用 SPSS 统计 软件 完成 计算 。 
114 





例 12-1 
岛 素 及 生长 素 的 二 元 





线性 回归 方程 。 
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20 名 糖尿 病人 的 血糖 、 胰 岛 素 及 生长 素 的 测定 值 列 于 下 表 中 , 试 建立 血糖 对 于 胰 


表 12-2 ”糖尿 病人 的 血糖 、 胰 岛 素 及 生长 素 的 测定 值 








病例 号 血糖 (mmol/L) 胰岛 素 ( mU/L) 生长 素 ( bg 儿 ) 
i 半 有 X2 
1 区 12.21 13.2 9.51 
2 14.54 16.7 11.43 
入 227 11.9 753 
4 12.04 14.0 12.17 
5 7.88 19.8 二 
6 11.10 16.2 13.52 
7 10.43 17.0 10.07 
8 13.32 10.3 18.89 
9 19.59 5.9 13.14 
10 9.05 18.7 9.63 
11 6.44 25.1 5.10 
上 9.49 16.4 4.53 
13 10.16 22.0 2.16 
14 8.38 233 4.26 
15 8.49 23.2 3.42 
16 TT 25.0 7.34 
17 11.38 16.8 1275 
18 10.82 112 10.88 
19 12.49 13.7 11.06 
20 9.21 24.4 9.16 





根据 上 述 研 究 问题 , 采用 多 元 线性 回归 方法 ,其 
了 =b +bX,+ 








回归 方程 为 
b,X, 


使 用 表 12-2 数据 拟 合 该 方程 , 由 SPSS 统计 软件 可 得 到 表 12-3 的 主要 结果 。 


表 12-3 ”回归 系数 估计 结果 











变量 回归 系数 标准 误 t P 
常数 项 17.011 2.472 6.880 <0.001 
XX -0.406 0.094 -4.313 <0.001 
兹 0.098 0.116 0.843 0.411 





由 此 得 到 回归 方程 为 


Y=17.011- 0.406X, 


+ 0.098 部 


`“、 多 元 线性 回归 方程 的 假设 检验 


由 样本 计算 出 的 回归 系数 b, 是 总 体 回归 系数 B 的 估计 值 Y=1,2,…,m)。 如 果 总 体 回归 
系数 等 于 0, 则 由 于 存在 抽样 误差 , 仍 可 使 样本 估计 的 回归 系数 不 等 于 0。 与 直线 回归 的 情形 相 


同 , 需 对 所 建立 的 多 元 回归 方程 进行 假设 检验 , 以 判 
方程 的 假设 检验 分 为 模型 检验 和 单个 回归 系数 检验 。 





断 它 是 否 具有 统计 学 意义 。 多 元 线性 回归 
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(一 ) 模型 检验 

可 用 方差 分 析 方 法 检验 应 变量 了 与 m 个 自 变 量 之 间 是 否 存 在 线性 回归 关系 。 在 有 多 个 自 
变量 的 情况 下 , 应 变量 总 离 均 差 平方 和 SSw 可 分 解 成 回归 平方 和 SSaw 和 残 差 平方 和 SSyey 两 个 
部 分 . 即 








(12-4) 
其 中 , 总 离 均 差 平方 和 为 
Ss-T0-P-Fr- (12.5) 
回归 平方 和 为 
SS = DE- 7 = Dhl (12-6) 
其 中 性 为 回归 系数 , 少 为 第 /个 自 变量 与 应 变量 了 的 离 均 差 积 和 。 残 差 平方 和 为 
SSaz = DO —Y)? = SSe 一 SS (227) 
各 离 均 差 平方 和 所 对 应 的 自由 度 分 别 为 vw=n 一 1, van=m, vax%=n 一 m 一 1。F 统 计量 计算 公式 为 
SS /mM a MS lay 
SSax/n—m-D) MMS (12-8) 
在 无 效 假设 : ,= 一 …=p。=0 成 立 条 件 下 ,统计 量 厂 服从 Fr 分布， 如 果 FE) 


则 在 a 水 平 上 拒绝 防 , 认为 产 个 自 变量 站 ,和 区 ,…, 思 与 应 变量 了 之 间 存 在 线性 回归 关系 , 即 回 
归 方 程 有 统计 学 意义 ; 否则 , 不 拒绝 思 , 即 回归 方程 无 统计 学 意义 。 
对 于 例 12-1, 模型 检验 的 假设 为 


Ho: Bi=p,=0 
到 :P10 和, 队 0 至 少 有 一 个 成 立 
a=0.05 


由 SPSS 统计 软件 可 得 到 表 12-4 的 模型 检验 结果 。 结 果 显示 ,=21.54, P<0.0001, 拒绝 
反 , 即 所 求 回归 方程 具有 统计 学 意义 。 


表 12-4 回归 方程 的 方差 分 析 表 











变异 来 源 SS V MS 上 P 
回归 116.626 2 58.313 21.539 <0.0001 
残 差 46.025 1 2.707 

总 变异 162.651 19 





(二 ) 偏 回 归 系 数 检验 

回归 方程 具有 统计 学 意义 , 只 能 说 明 整 体 的 情况 , 并 不 能 保证 每 个 自 变量 都 共有 统计 学 意 
义 。 因 此 ,需要 对 每 个 自 变 量 的 回归 系数 进行 假设 检验 ,具体 有 下 检 验 和 1 检验 两 种 方法 ,两 种 
检验 方法 的 结果 相同 。 





1. FF 检验 

(1) 建立 检验 假设 , 确定 检验 水 准 
Hh:p=0 

Hi: pb#0 

0=0.05 


(2) 计 算 F 统 计量 
首先 , 建立 含有 加 个 自 变量 的 回归 方程 ,并 计算 回归 平方 和 SSwuw 和 残 差 平方 和 SSnx。 然 


第 十 二 章 ”多 元 线性 回归 


后 ,将 拟 检验 的 自 变 量 号 = 1.2.…,m) 从 中 剔除 ,重新 建立 含 玫 -1 个 自 变 量 的 回归 方程 , 并 
计算 不 包含 总 的 回归 平方 和 SSanc, 则 蕊 =SSan-SSano 为 蕊 单独 引起 的 回归 平方 和 的 改变 
量 , 称 其 为 偏 回 归 平 方 和 ( 自由 度 为 1)。 最 后 计算 正统 计量, 即 
1 
” SSsxw/(n—m—l) 
(3) 在 且 成 证 时 .万 服从 Fwn 分 布 。 查 方差 分 析 F 厂 界 值 表 ,如 果 万 = Fam 即 P<a. 
则 在 a 水 平 上 拒绝 已 , 认为 自 变 量 蕊 具有 统计 学 意义 。 
对 于 例 12-1, 胰岛 素 因 和 生长 素 太 全 部 纳入 回归 方程 时 ,有 
| SSian=116.6265, SSye:=46.0249 
把 为 从 回归 方程 中 取出 ,建立 总 与 了 的 回归 方程 为 
?=7.012+0.429X, 


(12-9) 







此 时 
SSiawi(-1=66.2746 
UI= SS — SSiiw w= 116.6265 —66.2746=50.3519 
若 把 各 从 回归 方程 中 取出 .建立 与 了 的 回归 方程 为 
Y=18.7961- 0.4585X, 
此 时 
SSiayac2)= 114.7032 
U,= SS — SSia »= 116.6265 —114.7032= 1.9233 
由 公式 (12-9 ) 得 





注 志 U/l _ 50.3519/1 i 
SSyx /nn—m—l) 46.0249/(20-2—1) 
U,/l 1.9233/1 0 








SS /(n—m-1l) 46.0249/(20 -2—1) 


查 下 界 值 表 ( 附 表 4), Foos0.17)=3.59, 忆 >3.59, 忆 <3.59。 因 此 ,在 x=0.05 水 平 上 ,可 以 认 
为 胰岛 素 对 血糖 的 作用 有 统计 学 意义 (P<0.05), 而 生长 素 则 对 血糖 变化 无 影响 (P>0.05 )。 

2. {检验 ”无 效 假设 为 防 : 久 =0, 备 择 假设 为 也 :及 #0。t 检 验方 法 比 忆 检验 更 为 简便 , 检 
验 统计 量 为 


7 


1 和 (12-10 ) 
-车 ~ 


其 中 5; 为 偏 回 归 系 数 b 的 标准 误 。 

由 表 12-3 中 的 回归 系数 的 估计 结果 , 按 公 式 (12-10),X 的 检验 结果 为 = -4.31, P=0.0005; 
为 的 检验 结果 为 4 = 0.84, P=0.411。 结 论 与 方差 分 析 检 验 结果 相 同 , 即 胰岛 素 对 血糖 水 平 的 作 
用 具有 统计 学 意义 , 生长 素 则 未 显示 出 其 对 血糖 的 作用 。 


三 . 实 例 


例 12-2 为 研究 影响 楼 尿 病 种 者 禄 化 血红 恒 自 (HbAle) 的 主要 危险 因素 , 某 研究 者 收集 了 
糖尿 病 患 者 的 糖化 血红 蛋白 (Y, %)、 年 龄 (|, 岁 )、 体重 指数 ( 芒 , kgjm2)、 总 胆固醇 ( 交 、 mmol/L )、 
收缩 压 ( 生 ,mmHg ) 和 舒张 床 ( 疏 ， mmHg ) 等 数据 资料 。 现 从 中 随机 抽取 了 20 例 , 数据 见 表 12-5， 
试 作 多 元 线性 回归 分 析 。 
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表 12-5 20 例 糖尿 病 患 者 的 数据 资料 


全 本 二 XXX 





49 3219 60 148 86 7.6 11 53 23.43 7.1 161 86 753 
G67 D497 MRT 151 ‘98 ‘74 12 46 3056 29 146 79 7.3 
64 2524 7.0 151 80 7.4 13 59 25.19 60 158 80 73 
6G 2d260043. 0 S70 on 1 14 76 2726 5.4 124 85 6.9 
30.28 35 136 83 7.3 15 63 23.93 6.7 133 89 7.5 
A8, “D618 17.6 37 87 "76 16 74 2494 79 166 82 7.9 
66 26.36 5.9 157 ‘gf 7 17 5 WR 149 71 73 
4700 332.07. "S70 L570 R30 077 18 64 2434 2.5 126 93 6.8 
64 2844 61 154 82 7.3 19 54 25.44 26 151 83 6.9 
3065. 69 | 137 86, 77 20 78 28.98 72 147 74 7.5 


DA Www 一 
a 
% 


己 
已 
| 
u 











对 于 表 12-5 的 数据 用 SPSS 统计 软件 计算 , 主要 结果 见 表 12-6 和 表 12-7。 
表 12-6 回归 方程 的 方差 分 析 表 














变异 来 源 SS Vv MS 所 P 
回归 1.07906 5 0.215 81 衣 3 0.0015 
残 差 0.41294 14 0.029 50 

总 变异 1.492 00 19 








表 12-7 偏 回归 系数 估计 结果 





变量 偏 回归 系数 标准 误 t 2 
常数 项 3.875 98 1.01115 3.83 0.0018 
Xl -0.00153 0.00409 -有 37 0.7146 
和 0.031 92 0.013 48 2.37 0.0328 
如 0.10834 0.024 51 4.42 0.0006 
总 0.00850 0.003 68 2 0.0366 
Xs 0.01058 0.006 63 1.60 0.1328 


由 表 12-6 可 见 , F=7.32, P<0.01, 此 回归 方程 有 统计 学 意义 。 由 表 12-7 可 见 , 自 变量 胃 、 
矿 、 瑟 按 a=0.05 水 平 有 统计 学 意义 ,但 多 和 太 无 统计 学 意义 。 
需要 注意 , 因为 自 变量 之 间 可 能 存在 一 定 的 相关 性 , 当 从 原 方程 剔除 一 个 变量 时 , 其 他 一 
些 变量 的 回归 系数 可 能 受到 影响 。 另 外 , 有 时 需要 比较 各 自 变 量 的 相对 贡献 大 小 , 由 于 回归 系 
数 受 变量 度量 衡 的 影响 , 不 能 直接 比较 。 为 此 , 可 以 对 回归 系数 进行 标准 化 处 理 , 消除 度量 稀 
的 影响 , 计算 标准 化 回归 系数 (standardized regression coefficient )， 反映 各 自 变 量 对 应 变量 的 影响 
程度 。 计 算 公 式 为 
y= ] (12-11) 


5, 
式 中 ,忠和 时分 别 为 自 变量 蕊 及 应 变量 了 的 标准 差 , 己 为 蕊 的 回归 系数 。 


四 、 复 相关 系数 和 决定 系数 


1. 复 相关 系数 ”表示 回归 方程 中 的 全 部 自 变 量 X 与 应 变量 Y 的 相关 密切 程度 。 和 简单 相 
关系 数 不 同 的 是 , 复 相关 系数 ( multiple correlation coefficient ) 取 值 总 为 正 值 , 简 记 为 R(0=<R<1)。 
计算 公式 为 
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R= |SSam _ | _ SS (12-12) 
SS SS 


2. 决定 系数 ” 复 相 关系 数 的 平方 称 为 决定 系数 (coefficient of determination), 记 为 R*, 反映 
线性 回归 方程 能 在 多 大 程度 上 解释 应 变量 了 的 变异 性 。 其 定义 为 
SB a SS 

SS SS。 

决定 系数 RR 反映 了 回归 方程 与 数据 的 拟 合 程度 , 其 值 越 接近 1, 说 明 回归 方程 的 拟 合 程度 
越 好 ; 反之 , 其 值 越 接近 0, 说 明 回归 方程 的 拟 合 程度 越 差 。 例 12-2 中 R=0.7232, 说 明 由 年 龄 、 
体重 指数 、 总 胆固醇 收缩 压 和 舒张 压 可 解释 该 样本 糖化 血红 蛋白 变异 的 72.32%。 





R*= 





(12-13) 
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多 元 线性 回归 分 析 中 , 当 自 变量 较 多 时 , 可 能 并 不 是 所 有 自 变量 都 对 应 变量 有 显著 影响 
同时 有 些 自 变量 之 间 可 能 相关 , 存在 信息 重 准 和 共 线 的 问题 。 通 常情 况 下 ， 更 希望 将 有 统计 学 
意义 的 自 变量 引入 回归 方程 , 以 使 方程 更 为 简单 ,容易 解释 。 更 重要 的 是 , 把 不 显著 的 自 变量 
排除 后 可 以 使 回归 方程 的 残 差 均 方 减 小 ,有 利于 揭示 其 他 自 变量 的 作用 。 为 此 可 以 采用 三 种 自 
变量 筛选 方法 , 即 向 前 选择 法 (forward selection )、 向 后 选择 法 (backward elimination ) 和 逐步 选择 
法 ( ee selection )。 

- 向 前 选择 法 方程 由 一 个 自 变 量 开始 , 每 次 引入 一 个 偏 回 归 平方 和 最 大 、 且 具有 统计 学 
ie 变量 , 由 少 到 多 , 直到 个 其 有 统计 意义 的 因素 可 以 引入 为 止 。 这 种 方法 的 主要 问题 是 ， 
先进 入 方程 的 变量 有 可 能 受到 后 进入 方程 变量 的 影响 变 得 不 显著 。 

2. 向 后 选择 法 ” 先 建立 一 个 包含 所 有 自 变量 的 回归 方程 ,然后 每 次 剔除 一 个 偏 回归 平方 和 
最 小 、 且 无 统计 学 意义 的 自 变量 , 直到 不 能 剔除 时 为 止 。 这 种 方法 在 样本 量 比较 大 (如 n> 100)， 
或 者 自 变量 不 是 很 多 的 情况 下 (如 m<10) 效 果 较 好 。 

3. 逐步 选择 法 在 前 述 两 种 方法 的 基础 上 进行 双向 第 选 的 一 种 方法 。 即 向 前 引入 每 一 个 
新 自 变量 之 后 都 要 重新 对 先前 已 选 人 的 自 变 量 进行 检查 , 以 评价 其 有 无 继续 保留 在 方程 中 的 价 
值 。 为 此 需要 "引入 ”和 剔除 " 交替 进行 , 直到 无 统计 学 意义 的 新 变量 可 以 引入 也 无 自 变量 可 
以 剔除 时 为 止 。 

上 述 筛选 自 变量 三 种 方法 , 可 以 计算 偏 回归 平方 和 的 正统 计量 , 即使 用 公式 (12-9 ) 进 行 检 
验 和 筛选 。 有 时 也 采用 校正 决定 系数 (adjusted R-square )R2 作为 判断 标准 , 选择 校正 决定 系数 
大 者 为 "最 优 ” 方程。 校正 决定 系数 的 计算 公式 为 

R10 RY 1 Me 
n=p=1 MS 
式 中 p(p=1,2,…, m) 为 方程 中 包含 的 自 变量 个 数 。 

在 进行 逐步 回归 前 , 首先 应 确定 检验 每 个 自 变量 是 否 有 统计 学 意义 的 下 检验 水 平 , 以 此 作 

为 引 闪 或 短 除 性 年 的 标准 。 下 检验 水 平 可 以 根据 具体 情况 而 定 。 一 般 而 言 , 若 使 最 终 的 回归 方 
程 中 包含 较 多 的 自 变量 , 严 水 平 可 以 适当 放宽 些 , 但 也 不 能 取得 太 低 , 否则 会 失去 筛选 自 变量 的 
意义 。 一 般 可 将 亚 值 定 在 x 为 0.05、0.10 或 0.20 水 平 上 ,同时 要 求 ms、<ayss。 

逐步 回归 法 最 后 得 到 的 “最 优 ” 回归 方程 , 与 所 给 的 临界 值 的 选择 有 关 , 无 法 保证 所 挑选 的 
回归 方程 在 任何 准则 下 都 是 最 优 的 。 回归 方程 是 否 合理 需要 结合 专业 知识 进行 判断 。 

对 例 12-2 进行 ea 1, 采用 逐步 法 筛选 自 变量 , 选 入 水 准 为 0.10, 剔除 水 准 为 0.15， 
SPSS 软件 计算 过 程 及 相应 结果 见 表 12-8 至 表 12-11。 








(12-14) 
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表 12-8 多 元 逐步 回归 结果 








模型 ( 步骤 ) 变量 偏 回归 系数 标准 误 ”标准 偏 回 归 系 数 t P 
第 1 步 常数 6.774 0.156 一 43.545 0.000 
2 0.110 0.027 0.693 4.079 0.001 
第 2 步 常数 6.040 0.432 一 13.967 0.000 
> 0.111 0.025 0.697 4.350 0.000 
pa 0.027 0.015 0.289 1.805 0.089 
第 3 步 常 4.799 0.667 一 7.193 0.000 
站 0.097 0.024 0.611 4.125 0.001 
太 0.031 0.014 0.330 2.287 0.036 
疡 0.008 0.004 0.341 2.285 0.036 





表 12-9 ”多 元 逐步 回归 方差 分 析 表 











模型 ( 步骤) 变异 来 源 SS Vv MS a Pp 
第 1 步 回归 0.717 1 0.717 16.640 0.001 
误差 0.775 18 0.043 
总 变异 1.492 19 
第 2 步 回归 0.841 2 0.421 10.993 0.001 
误差 0.651 17 0.038 
总 变异 1.492 19 
第 3 步 回归 1.001 3 0.334 10.889 <0.001 
| 误差 0.491 16 0.031 
总 变异 1.492 19 








| 表 12-10 ”多 元 逐步 回归 的 复 相关 系数 和 决定 系数 表 











模型 (步骤 ) 复 相关 系数 决定 系数 
第 1 步 0.693 0.480 
第 2 步 0.751 0.564 
第 3 步 0.819 0.671 





表 12-11 未 进入 方程 的 自 变量 








模型 (步骤 ) 变量 标准 化 系数 t Pp 

第 1 步 源 -0.154 -0.889 0.386 

驹 0.289 1.805 0.089 

如 0.298 1.803 0.089 

站 0.174 0.987 0.337 

第 2 步 渐 -0.128 -0.775 0.450 

| 和 0.341 2.285 0.036 
高 0.191 1.161 0.263 

| 第 3 步 A -0.043 -0.274 0.788 
| 秋 0.232 1.626 0.125 








最 后 得 到 的 回归 方程 为 


笔记 GG P=4.799 + 0.031X,+ 0.097X, + 0.008X, 
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根据 上 述 结果 , 可 以 认为 体重 指数 六、 总 胆固醇 和 和 收缩 压 加 是 影响 糖化 血红 蛋白 的 主 
要 因素 





第 三 节 ”多 元 线性 回归 的 注意 事项 


1. 应 用 条 件 ”多 元 线性 同 归 原 则 上 要 求 应 变量 是 连续 型 变量 , 其 预测 值 与 实际 观测 值 的 
差 值 ( 即 残 兰 ) 服 从 正 态 分 布 , 并 且 在 不 同 的 立 取 值 上 方差 相同 。 另 外 , 要 求 应 变量 的 观测 值 相 
互 独立 , 对 于 传染 性 疾病 等 数据 应 谨慎 处 理 。 

2. 样本 含量 ”多 元 线性 回归 既 可 用 于 大 样本 资料 , 又 可 用 于 小 样本 资料 , 但 是 如 果 方 程 中 
自 变 盘 的 个 数 m 较 多 ,样本 兮 量 相对 于 m 并 不 很 大 时 ,建立 的 回归 方程 会 很 不 稳定 ,常常 有 
较 大 的 RR, 容易 造成 一 种 假象 。 因 此 , 实际 计算 时 应 注意 与 m 的 比例 , 经验 上 1 至 少 应 是 方 
程 中 自 变 量 个 数 关 的 S~10 倍 。 

3. 定性 变量 的 数量 化 ”在 多 元 线性 回归 中 , 自 变量 通常 是 连续 型 变量 , 而 对 于 无 序 分 类 变 
量 必 须 数量 化 ; 有 序 变 其 则 可 根据 实际 情况 选择 直接 引入 回归 方程 或 数量 化 后 引入 回归 方程 。 

(1) 三 分 类 定性 变量 处 理 方法 : 如 对 于 性 别 变量 六 的 赋值 方法 为 
男性 ， 成 沁 本 







0， 女 性 本 信和 0， 男 性 
(2) 多 分 类 定性 变量 处 理 方法 : 如 果 有 类, 则 可 用 -1 个 取 值 为 0 或 1 的 哑 变 量 (dummy 


variable ) 来 赋值 表达 , 如 血型 分 为 A、B、AB 和 0 型 , 对 于 血型 变量 万 的 赋值 (以 0 型 为 对 照 ) 方 
法 为 




















- A 型 _ 用 ，B 型 用，AB 型 
” [o， 其 他 血型 ”>” 0， 其 他 血型 ' 其 他 血型 


多 分 类 定性 变量 与 哑 变 量 取 值 的 对 应 关系 可 用 表 12-12 表述 。 


表 12-12 ”血型 变量 的 哑 变 量 赋值 方法 











血型 分 组 编码 哑 变 量 

xX G xX, X X; 
0 型 1 0 0 0 
A 型 2 1 0 0 
B 型 EE 0 0 
AB 型 4 0 0 1 


A 


(3) 有 庄 变 量 处 理 方法 : 如 病情 分 为 " 轻 、 中 、 重 ", 可 以 按 *1.2.3" 的 赋值 方法 直接 引入 回 
归 模 型 。 如 果 翌 本 量 较 大 , 也 可 按 多 分 类 定性 变量 进行 数量 化 后 引入 回归 模型 。 采 用 何 种 方法 
进行 赋值 应 视 具 体 情况 而 定 , 一 般 可 通过 评价 上 述 两 种 赋值 方法 的 差异 , 选择 最 佳 的 方式 引入 
回归 方程 

4. 多 重 共 线 性 ” 当 自 变量 问 存在 较 强 的 线性 关系 时 ,会 使 多 元 回归 方程 中 的 参数 估计 不 
准确 ,影响 多 元 线性 回归 分 析 的 结果 。 如 研究 高 血压 与 年 龄 .吸烟 年 限 、 饮 白酒 年 限 等 因素 的 
关系 ， ep 变量 通常 是 相关 的 , 如果 这 种 相关 程度 非常 高 ,使 用 最 小 二 乘法 建立 回归 方程 就 
有 可 能 不 合理 

5. 关于 变量 筛选 ”在 和 变量 较 多 的 情况 下 . 使 用 逐步 回归 分 析 常 能 使 问题 得 到 简化 . 较 快 
地 得 到 结果 但 必须 指出 : 不 要 将 肯 信任 逐步 回归 得 到 的 结果 、 所 谓 的 “最 优 ” 回归 方程 不 一 定 
足 起 好 的 ,没有 选 入 方程 的 变量 也 未 必 没 有 意义 。 选 择 不 同 的 检验 水 于, 其 回归 方程 的 结果 可 
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能 不 一 致 ; 相同 的 变量 在 不 同 变量 组 合 中 得 到 的 检验 P 值 也 可 能 不 同 。 建 立 回归 方程 时 , 最 好 
结合 所 要 研究 的 问题 和 专业 知识 确定 应 选择 的 变量 。 











练习 题 
一 、 单 项 选择 题 | 
1. 在 疾病 发 生 危 险 因素 的 研究 中 ,采用 多 变量 回归 分 析 的 主要 目的 是 (。 ) 
A. 节省 样本 B. 提高 分 析 效率 
C. 克服 共 线 影响 D. 减少 异常 值 的 影响 
E. 减少 混杂 的 影响 
Be A 了 的 总 离 均 差 平方 和 中 所 占 比 重 的 统 
计量 是 ( ) 
A. 简单 相关 系数 B. 复 相关 系数 
C. 偏 回 归 系 数 D. 回归 均 方 
E. 决定 系数 有 到 
3. 对 同一 资料 作 多 变量 线性 回归 分 析 , 若 对 两 个 具有 不 同 个 数 自 变 量 的 回归 方程 进行 比 
较 , 应 选用 的 指标 是 ( 。 ) 
A. 决定 系数 B. 相关 系数 
C. 偏 回归 平方 和 D. 校正 决定 系数 
E. 复 相 关系 数 
4. 多 元 线性 回归 分 析 中 ,反映 自 变 量 对 应 变量 的 作用 大 小 的 是 ( ) 
A. 决定 系数 B. 标准 化 偏 回 归 系 数 
C. 偏 回归 平方 和 D. 校正 决定 系数 
E. 复 相 关系 数 
ie ) 
A. 所 有 自 变量 量 间 是 否 存 在 线性 回归 关系 
B. 部 分 自 tn ee 
| C. 自 变 量 与 应 变量 间 存 在 的 线性 回归 关系 是 否 较 强 
| D. 自 变 量 之 间 是 否 存 在 共 线 
E. 回归 方程 的 拟 合 优 度 
| 6. 在 多 元 回归 分 析 中 , 若 对 某 个 自 变 量 的 值 都 乘 以 一 个 不 为 零 的 常数 , 则 (  ) 
| A. 偏 回归 系数 不 变 、 标 准 回 归 系 数 改变 B， 偏 回归 系数 改变 、 标 准 回归 系数 不 变 
C. 偏 回归 系数 与 标准 回归 系数 均 不 改变 D. 偏 回归 系数 与 标准 回归 系数 均 改 变 
E. 偏 回 归 系 数 和 决定 系数 均 改 变 


7. 以 下 不 是 多 元 线性 回归 模型 应 用 必须 满足 的 条 件 是 ( ) 


A. 应 变量 与 自 变量 存在 线性 关系 B. 应 变量 值 相互 独立 


| ”GC. 残 差 服从 正 态 分 布 D. 自 变量 服从 正 态 分 布 
| E. 对 任意 一 组 自 变 量 应 变量 具有 相同 方差 
8. 多 元 线性 回归 中 的 多 重 共 线性 指 的 是 ( ) 
立 变 量 与 自 变 量 存在 线性 关系 B. 应 变量 与 多 个 自 变量 相关 
C. 自 变量 之 间 存 在 线性 相关 D. 应 变量 之 间 存 在 线性 相关 








世 比 值 (六 )，; 


假如 其他 





+ 


”102 





向 国 归 3 


第 十 二 章 ”多 元 线性 回归 












的 血脂 ,应 


B. 残 差 服从 正 态 分 布 
D. 了 在 不 同 的 半 取 值 上 方差 相同 


二 通 . 了 


变量 


低 密 度 脂 蛋白 与 高 密度 脂 蛋白 含 


?=8.837 +0.014TC -0.001TG—0.033ApoA +0.011ApoB 


A. 0.l10ms dl 


G. 
BE. 


20.000me/dl 


0.220me/ 


二 、 计 算 与 分 析 







dl 


B. 1.248Smg/dl 
D. 3.644meg/dl 





ApoB 由 100mgy/dl 增加 到 120mg/dl, 工 的 平均 改变 莹 是 ( ) 


大 态 下 ,儿童 年 龄 ( 岁 )、 身 高 (cm) 与 体重 (kg) 测 定 结 果 见 下 表 ， 
的 二 元 回归 方程 ; 加 对 回归 方程 作 检 验 ; 图 计算 复 相关 系数 与 


和 标准 偏 回归 系数 





营养 缺乏 儿童 年 龄 、 身高、 体重 测定 值 
编号 (站) 1 2 § 4 5 000 00 0 4102 
身 商 (en 5 150 124 157 129 127 140 122 107 107 155 148 
年 龄 ( 岁 ), 总 8 10 6 1 8 7 10 SA 人 到 8 
体重 (kg). 29 32 24 30 25 2% 3 26 25 23 35 31 





个 重要 原因 ,，， 现 ; 
载 脂 蛋 白 C、 低 密度 脂 












(1) 分 别 作 六 和 六 对 总 站、 站 的 多 元 线性 回归 分 析 ; 
面 的 分 析 结 果 进 行 比较 。 


(2) 作 8 对于、 其 、 避 总 的 逐步 回归 分 析 , 并 与 前 


30 名 动脉 硬化 疑似 患者 的 观测 资料 


SR 
含量 


认为 ,血清 中 低 密 度 脂 蛋白 增高 和 高 窗 度 脂 蛋 白 降低 ,是 引起 动脉 硬化 的 一 
党 了 30 名 动脉 硬化 疑似 患者 的 载 脂 蛋 自 AL、 载 脂 蛋白 B、 载 脂 蛋 白 E、 
自 中 的 胆固醇 、 高 密度 脂 蛋白 中 的 胆固醇 


,资料 见 下 表 。 








载 脂 蛋白 Al ” 载 脂 蛋 白 B ” 载 脂 蛋白 E 。 载 脂 蛋 白 C， 低 密度 脂 蛋 白 ”高 密度 脂 蛋白 
序号 (mg/dl) (mg/dl) (mg/dl) (mg/dl) (mg/dl) {mg/dl) 
i Xi X2 Xs Xs Yi 洛 
1 173 106 7.0 14.7 学 62 
2 139 132 6.4 178 162 43 
3 198 112 6.9 16.7 134 81 
4 118 138 | 15 光 188 39 
5 139 94 8.6 13.6 138 51 
6 155 160 12.1 20.3 215 65 
7 131 154 11.2 21.5 171 40 
8 158 141 9.7 29.6 148 42 
9 i58 137 74 18.2 197 50 
10 132 151 7.5 17.2 113 37 
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续 表 
载 脂 蛋白 A! ” 载 脂 蛋白 B ” 载 脂 蛋白 E ” 载 脂 蛋白 C” 低 密度 脂 蛋 白 ”高 密度 脂 蛋 白 
序号 (mg/dl) (mg/dl) {mg/di) (mg/dl) (mg/d!) (mg/dl) 
i XI 2 0 xX, a y 
11 162 110 6.0 15.9 145 70 
12 144 113 10.1 42.8 81 41 
13 162 137 7.2 20.7 185 56 
14 169 129 8.5 16.7 157 58 
15 129 138 6.3 10.1 197 47 
16 166 148 11.5 33.4 156 49 
I 185 118 6.0 17.5 156 69 
18 155 121 6.1 20.4 154 57 
19 175 111 4.1 7 144 74 
| 20 136 110 9.4 26 90 39 
21 153 133 8.5 16.9 215 65 
22 110 149 9.5 24.7 184 40 
23 160 86 5.3 10.8 118 57 
24 112 123 8.0 16.6 127 34 
25 147 110 8.5 18.4 137 54 
| 26 204 122 6.1 21.0 126 7 
2 131 102 6.6 13.4 130 51 
28 170 127 8.4 24.7 135 62 
| 29 173 123 8.7 19.0 188 85 
| 30 132 131 13.8 29.2 122 38 
( 妖 二) 
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第 十 二 章 介 绍 的 线性 回归 可 以 用 于 分 析 应 变量 为 连续 型 变量 时 , 其 与 自 变量 之 间 的 线性 依 | 
存 关 系 。 但 是 在 医 党 全 究 中 应 变 基 有 时 是 二 分 类 结果 , 如 发 病 与 不 发 病 .死亡 与 生存 .有 效 与 
无 效 .复发 与 未 复发 等 , 显然 这 类 变量 不 满足 正 态 分布 的 条 件 。 当 需要 研究 二 分 类 应 变量 的 影 
响 因 素 时 , 不 适合 用 线性 回归 分 析 , 这 时 可 以 采用 logistic 回归 分 析 (logistic regression analysis )s 
logistic 回归 属于 概 次 型 下 线性 回归 , 它 是 研究 二 分 类 (可 以 扩展 到 多 分 类 ) 反 应 变量 与 多 个 影响 
因素 之 问 关 系 的 一 种 多 变 是 分 析 方 法 .logistie 回归 模型 参数 具有 明确 的 实际 意义 , 现 已 成 为 处 
理 分 类 型 数据 的 常用 方法 。 








第 一 节 logistic 回归 


一 、logistic 回归 模型 


(一 ) logistic 回归 模型 
设 有 一 个 二 值 应 变 旺 也. 取 值 为 | 


b 出 现 阳性 结果 ( 发病, 有 效 、 死 亡 、 复 发 等 ) 
0， 出 现 阴 性 结果 (未 发 病 无效、 生存 .未 复发 等 ) 


男 有 m 个 影响 Y 取 值 的 自 变 量 针 ,入 ,…,%,, 观察 到 例 样本 数据 如 表 13-1 所 示 。 





表 13-1 logistic 回归 分 析 数 据 格式 








例 号 i 六 2 Xo Y | 
1 i Xs Xn 1 
2 % 太 , Xm 9 
3 Xa Xs XX 1 
n 如 1 Xz 总 0 





记 在 这 m 个 自 变 量 作 用 下 阳性 结果 发 生 的 概率 为 P=P(Y= 1 ,总站 训 ,), 则 logistie 
回归 模型 可 表示 为 
p= 1 
1+exp[ 一 (8 + PBX, + BX, + +p,X,)] 


其 中 记 称 为 常数 项 或 截 距 ,Bi,PB,,…,p 称 为 模型 的 回归 系数 。 若 用 Z 表 示 mm 个 自 变量 的 线性 
组 合 Z=po+ 忆 二 + 己 训 十 …+X, 则 2Z 与 P 之 间 关 系 的 logistic 曲线 如 图 13-1 所 示 。 从 图 中 可 
以 看 出 : 省 乙 趋 于 +ce 时 , 己 值 渐 近 于 1; 当 Z 趋 于 -co 时 ,P 值 浙 近 于 0;P 值 的 变化 在 0~1 范围 
之 内 ,并 由 随 Z 值 的 增加 或 减少 号 S 形变 化 

对 式 (13- 由 作 空 换 ,1ogistiec 由] 模 地 可 以 表示 成 如 下 线性 形式 


(13-1) | 








Pp 
mn 人 (和 hh BX, + bX, 人 Bi (13:2) | 笔 记 
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| 式 (13-2) 等 号 左 端 为 阳性 结果 与 阴性 结果 发 生 概 率 之 比 的 自然 对 数 , 称 为 P 的 logit 变换 , 记 为 
| logit(P)。 可 以 看 出 ,虽然 概率 P 的 取 值 范围 在 0~1 之 间 , logit(P) 却 没有 数值 界限 。 


| . 2 





图 13-1 logistic 曲线 示意 图 


(二 ) 模型 参数 的 意义 
| 为 便于 理解 , 通常 以 流行 病 学 研究 为 例 来 说 明 模型 参数 的 意义 。 如 果 把 logistic 模型 中 的 P 
| 看 作 是 在 某 一 暴露 状态 下 发 病 的 概率 , 则 p 表示 所 有 暴露 剂量 为 0 时 发 病 与 不 发 病 概率 之 比 的 
| 自然 对 数 ,反映 了 疾病 的 基准 状态 。 回 归 系 数 B(j=1,2,…, m) 表 示 当 因素 改变 一 个 单位 时 
logit(P) 的 改变 量 , 它 与 衡量 危险 因素 作用 大 小 的 比 数 比 (odds ratio, OR) 有 一 个 对 应 的 关系 。 

设 自 变量 关 的 两 个 不 同 取 值 为 入 =cl 和 为 =co, 假定 其 他 因素 的 水 平 相同 , 由 流行 病 学 的 知 
识 可 知 ,两 个 不 同 暴 露水 平 为 =cl 和 为 =co 下 的 比 数 比 OR 的 自然 对 数 为 





P/Qd-P) 


InOR, =In 
7 |p/da-p) 


| =logit(P)—logit (PR) 





-rpatBax]- (a+patsas] (13-3) 


=p,(a— co) 
取 反 对 数 后 可 得 
| OR,=exp[B(c1—co)] (13-4) 
” 式 (13-3) 中 P, 和 P, 分 别 表示 在 入 取 值 为 ci 及 co 时 的 发 病 概率 。 特 殊 地 ,如果 思 赋值 为 
_ 1， 烘 器 
= 非 暴露 
则 暴露 组 与 非 暴露 组 发 病 的 比 数 比 为 
OR,=exp(p,) (13-5) 
当 B=0 时 ,OR=1, 说 明志 对 疾病 发 生 不 起 作用 ; 当 忆 >0 时 , OR>1, 说 明 因 是 一 个 危险 因素 ; 
当 忆 <0 时 , ORj<1, 说 明 句 是 一 个 保护 因素 。 在 具体 研究 中 可 结合 所 代表 的 因素 对 其 做 出 
| 恰当 的 解释 。 
由 于 OR 值 与 模型 中 的 常数 项 p 无 关 , 在 危险 因素 分 析 中 通常 把 po 看 作 无 效 参数 。 对 于 
发 病 率 较 低 的 疾病 如 恶性 肿瘤 , 比 数 比 可 以 作为 相对 危险 度 (relative risk, RR) 的 近似 估计 , 即 


| Rd Bn 

| BB 硫 (I 
由 此 可 见 , logistic 回归 模型 参数 有 明确 的 实际 意义 ， wid 人 回归 系数 的 估计 
值 后 , 便 可 以 估计 出 这 一 因素 在 不 同 水 平 下 的 比 数 比 , 甚至 相对 危险 度 。 这 是 logistic 回归 用 于 





流行 病 学 和 临床 数据 分 析 的 优势 。 
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-、 模 型 的 参数 估计 
在 logistic 回归 模型 中 , 回归 系数 的 估计 通常 用 最 大 似 然 法 ( maximum likelihood estimate， 
MLE )。 其 基本 思想 是 先 建立 一 个 样本 的 似 然 函数 , 求 似 然 函 数 达到 最 大 值 时 参数 的 取 值 , 即 为 
参数 的 极 大 似 然 估计 值 。 
样本 似 然 丙 数 可 表示 为 
Lr=I1?"a-P)™ (13-7) 


式 中 P, 表 示 第 i 例 观察 对 象 在 自 变量 的 作用 下 阳性 结果 发 生 的 概率 , 若 实际 出 现 的 是 阳性 结 
果 , 取 %=1, 否则 取 =0。 
为 了 求 出 当 工 值 最 大 时 的 参数 取 值 ,通常 取 工 的 对 数 形式 以 简化 计算 , 即 
InL=Y [Yinp+d-y)Ind-p)] (13-8) 
然后 用 办 代 方 法 使 对 数 似 然 函数 达到 极 大 值 , 此 时 参数 的 取 值 b, b1, by,…, b 即 为 po, Bi, PB,,…， 
Bn 的 最 大 似 然 估 计 值 。 上 述 求解 过 程 坷 要 利用 统计 软件 完成 。 
由 公式 (13-4) 可 得 , 某 因 素 两 个 不 同 水 平 (c, co) 比 数 比 的 估计 值 为 
OR,=exp[ bi( ce1—co)] (13-9) 


OR 的 可 信 区 间 可 以 利用 5b 的 抽样 分 布 来 估计 , 在 样本 量 含量 较 大 的 情况 下 , 它 近似 服从 正 态 
分 布 。 若 c 和 co 分 别 表示 暴露 和 非 暴露 , 则 比 数 比 OR 的 1-a 可 信 区 间 可 按 下 式 计算 








exp(O 一 zu )<OR < explb) + 26135,,) (13-10) 
式 中 5 的 值 及 可 信 区 间 可 由 统计 软件 给 出 。 
例 13-1 表 13-2 是 一 个 研究 吸烟 (为 )\ 饮 酒 (各 ) 与 食道 癌 ( 切 关系 的 病例 - 对 照 资 料 , 试 
作 logistic 回归 分 析 。 
表 13-2 ”吸烟 与 食道 癌 关 系 的 病例 -对照 调查 资料 
吸烟 饮酒 疾病 状态 观察 例 数 
Xi X2 Y n 
0 0 1 63 
0 1 1 63 
1 0 1 44 
1 1 1 265 
0 0 0 136 
0 1 0 107 
1 0 0 57 
1 1 0 151 





人 吸烟 _ 用 饮酒 ， 用， 病例 
0， 不 吸烟 ”” 【0, 不 饮酒 ” ”|[0， 对 照 


用 SPSS 统计 软件 logistic 回归 过 程 可 得 到 如 下 主要 结果 ( 表 13-3)， 





[os 
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表 13-3 例 13-1 logistic 回归 参数 估计 结果 














因素 回归 系数 标准 误 Wald 必 P 什 OR 值 OR 值 95% 可 信和 区间 
xX b So 下 限 上 限 
常数 项 -0.910 0.136 44.870 0.000 0.403 
吸烟 0.886 0.150 34.862 0.000 2.424 1.807 3.253 
饮酒 0.526 0.157 11.207 0.001 1.692 1.244 2.303 








吸烟 与 饮酒 的 logistic 回归 系数 分 别 为 0.886 和 0.526, OR 值 及 其 95% 可 信 区 间 分 别 为 
2.424(1.807~3.253 ) 和 1.692( 1.244~2.303 )。 

与 线性 回归 分 析 相同 , 因为 自 变量 的 单位 不 同 , 不 能 用 回归 系数 的 估计 值 来 判断 哪 一 个 自 
变量 对 应 变量 的 影响 最 大 , 为 此 需要 计算 出 标准 化 回归 系数 。 在 标准 化 回归 系数 的 估计 值 中 ， 
绝对 值 最 大 的 标准 化 回归 系数 对 应 的 自 变量 作用 最 大 。 

三 、logistic 回归 系数 的 假设 检验 

得 到 回归 系数 的 估计 值 后 , 还 需要 对 其 进行 假设 检验 。 对 回归 系数 的 假设 检验 , 可 用 来 说 
明 自 变量 对 应 变量 了 的 影响 是 否 具有 统计 学 意义 。 具 体 分 为 对 模型 整体 的 检验 和 对 单个 偏 回 
归 系 数 的 检验 , 对 应 的 检验 假设 分 别 为 

.0 二房 = 加 0 不 全 为 0 

Hh: p=0; Hi:p#0 
常用 的 检验 的 方法 有 似 然 比 检验 (likelihood ratio test)、Wald 检验 (Wald test) 和 计 分 检验 (score 
test 站 

1. 似 然 比 检验 ” 似 然 比 检验 的 基本 思想 是 比较 在 两 种 不 同 假设 条 件 下 的 对 数 似 然 函数 值 ， 
看 其 差别 大 小 。 具 体 做 法 是 先 拟 合 一 个 不 包含 准备 检验 因素 在 内 的 logistic 模型 , 求 出 它 的 对 数 
似 然 函 数值 In Lo, 然后 把 需要 检验 的 因素 加 入 模型 中 去 再 进行 拟 合 ,得 到 一 个 新 的 对 数 似 然 函 
数值 mn, 假设 前 后 两 个 模型 分 别 包 含 /个 自 变量 和 p 个 自 变量 , 似 然 比 统计 量 G 的 计算 公式 为 
G=2(InZi -Inzo) (13-11) 
当 样本 含量 较 大 时 , 在 零 假设 下 得 到 的 G 统计 量 近 似 服从 自由 度 为 4(4=p 一 站 的 多 分布 。 
车 G> 妈 ,时 ,表示 新 加 入 的 个 自 变量 对 回归 有 显著 的 贡献 。 如 果 只 对 一 个 回归 系数 检验 , 则 
d=1。 

由 例 13-1 可 以 算得 

InL(X)=-585.326, InL( 玉 )=-597.436, InL(X, Xa)=-579.711 
符号 (XX) 和 L( 玉 ) 分 别 表示 模型 中 只 含有 Y 和 郊 的 最 大 似 然 函 数值 , 而 L(Y, XX) 则 表示 模 
型 中 同时 含有 为 和 及 的 最 大 似 然 函数 值 。 
对 于 于: Bi=0; Hi: PB.#0 
G=2[InL(%, 铝 )-InL( 和 %)]=2[ 一 579.711 一 (597.436)]=35.45 
查 儿 界 值 表 得 x00s.1=3.84, G>3.84, 故 在 a=0.05 检验 水 准 上 拒绝 所 ,接受 局, 说 明 平衡 了 饮 
酒 因 素 的 影响 后 , 食管 瘤 与 吸烟 有 显著 性 关系 。 
同 理 ,对 于 到 :p=0; Hi: Pp.#0 
G=2[InL(X,B)-InL(X)]=2[-579.711-(-585.326)]=11.23 
G>3.84, 拒绝 友 ,, 接受 及 ,, 说明 平 衡 了 吸烟 因素 的 影响 后 , 食管 癌 与 饮酒 有 显著 性 关系 。 

2. Wald 检验 ”Wald 检验 只 需 将 各 参数 的 估计 值 b 与 0 比较 , 而 用 它 的 标准 误 S 作为 参 

照 ,为 检验 p=0 是否 成 立 ,计算 下 面 的 统计 量 , 即 
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z= 一 (13-12) 


| (13-13) 
Su 


对 于 大 样本 资料 , 在 零 假设 下 z 近似 服从 标准 正 态 分 布 , 而 如 则 近似 服从 自由 度 v= 1 的 六 
分 布 。 

计 分 检验 计算 公式 比较 复杂 , 此 处 省 略 。 三 种 方法 中 , 似 然 比 检验 可 以 对 自 变量 增 减 时 所 
得 到 的 不 同 回 归 模 型 进行 比较 , 既 适合 单个 自 变量 的 假设 检验 , 又 适合 多 个 自 变量 的 同时 检验 。 
Wald 检验 比较 适合 单个 自 变量 的 检验 , 但 结果 略为 保守 。 计 分 检验 在 小 样本 时 较 似 然 比 检验 
统计 量 更 接近 于 X 分 布 。 实 际 工作 中 应 注意 所 使 用 的 统计 软件 采用 的 是 何 种 检验 方法 , 不 同 的 
方法 所 得 的 结果 可 能 不 同 。 在 大 样本 情况 下 , 使 用 三 种 方法 得 到 的 检验 结果 是 一 致 的 。 

从 表 13-3 中 可 以 看 出 ,吸烟 和 饮酒 Wald x 值 分 别 为 34.862 和 11.207, 与 似 然 比 检验 的 结 
果 一 致 。 

四 .变量 筛选 
。” 当 对 多 个 自 变量 建立 logistic 回归 模型 时 , 并 不 是 每 一 个 自 变量 对 模型 都 有 贡献 。 通 常 我 们 
希望 所 建立 的 模型 将 具有 统计 学 意义 的 自 变量 都 包含 在 内 , 而 将 没有 统计 学 意义 的 自 变 量 排除 
在 外 , 即 进行 变量 筛选 。 与 多 元 线性 回归 相似 ,logistie 回归 的 变量 筛选 的 方法 有 向 前 选择 、 向 
后 选择 和 逐步 选择 三 种 方法 。 但 其 中 所 用 的 检验 统计 量 不 再 是 线性 回归 分 析 中 的 正统 计量 , 而 
是 logistie 回归 参数 检验 中 的 似 然 比 统计 量 、Wald 统计 量 或 计 分 统计 量 之 一 。 多 数 统计 软件 使 
用 的 是 似 然 比 统计 量 。 

例 13-2 某 医 院 在 研究 某 种 药物 治疗 骨折 效果 时 ,收集 了 516 例 病 例 资 料 , 对 每 一 患者 采 
用 相同 的 标准 按照 "好 、 差 "做 疗效 评价 。 在 评价 时 需要 同时 考虑 骨折 的 类 型 .是 否 手术 、 是 否 
服药 和 治疗 时 间 4 个 因素 对 结果 的 影响 。 数 据 资 料 见 表 13-4 和 表 13-5, 试 作 logistic 逐步 回归 
分 析 。 





表 13-4 骨折 治疗 效果 的 4 个 可 能 影响 因素 与 编码 说 明 








因素 变量 名 编码 说 明 
骨折 类 型 妊 闭合 =0, 开放 =1 
治疗 方法 丰 非 手术 =0, 手 术 =1 
服药 情况 流 未 服药 =0, 服药 =1 
治疗 周 数 XX 1~=1, 11~=2, 21~=3 
疗效 评价 Y 差 =0, 好 =1 





表 13-5 骨折 治疗 效果 评价 研究 资料 








分 层 Xi Xe Xs Xa 阳性 数 阴性 数 观察 例 数 
1 0 0 0 1 0 18 18 
区 0 0 0 2 2 15 17 
3 0 0 0 3 7 3 10 
4 0 0 1 1 10 68 78 
1 0 0 1 19 学 26 
6 郊 0 1 3 4 1 5 








笔记 
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分 层 Xi Xo Xs Xs 阳性 数 阴性 数 观察 例 数 
7 0 人 0 1 0 i 过 
8 0 1 0 2 3 25 28 

| 9 0 1 0 3 Wi 15 32 
10 0 1 1 1 2 91 96 
11 0 1 1 2 28 21 49 
12 0 1 1 | 19 3 p 
13 1 0 0 1 1 1 
14 1 0 0 2 0 2 2 
bb 1 0 0 3 1 3 4 
16 1 0 1 下 0 14 14 
17 1 0 2 4 8 12 
18 1 0 1 3 、] 6 
19 1 1 0 1 0 9 9 
20 1 1 0 2 0 13 13 
21 1 1 0 3 8 Ee: 13 
22 1 1 1 1 入 20 53 
23 1 1 L 2 7 1 8 
24 1 1 1 3 6 0 6 








将 治疗 周 数 化 为 旺 变量 , 见 表 13-6。 
表 13-6 ”治疗 周 数 的 哑 变 量 赋值 











三 变量 
水 平 Xi Xs.2 
1 0 0 
2 
3 0 1 





用 SPSS 向 前 选择 法 筛选 自 变 量 ( 似 然 比 检验 ), 确定 选 入 的 检验 水 准 为 a= 0.05。 经 过 两 
步 筛选 , 最 终 进 入 方程 的 自 变 量 有 服药 情况 和 治疗 周 数 , 结果 如 表 13-7 所 示 。 这 两 个 变量 回 
归 系 数 的 Wald 检验 尸 值 均 具有 统计 学 意义 , 提示 它们 是 骨折 治疗 效果 的 独立 影响 因素 。 在 相 
同 的 治疗 时 间 条 件 下 , 服药 骨折 病人 获得 好 疗效 的 可 能 性 比 不 服药 骨折 病人 更 大 , 其 比 数 比 为 
10.060; 在 相同 的 服药 情况 下 , 治疗 时 间 越 长 疗效 越 好 , 其 中 治疗 周 数 在 11 周 以 上 相对 于 11 周 
以 下 的 比 数 比 为 14.638, 治疗 周 数 在 21 周 以 上 相对 于 11 周 以 下 的 比 数 比 为 116.863。 





表 13-7 例 13-2 的 logistic 回归 模型 自 变量 筛选 结果 
因素 回归 系数 ”标准 误 





OR 值 95% 可 信 区 间 














| 5 x b So Vale 下 限 上 限 
| “第 1 步 。 常数 项 -2.528 0238 112.433 <0.001 0.080 
| 治疗 11 周 2.149 0.289 55.267 <0.001 8.578 4.867 15.117 
治疗 21 周 3299 ”0323 104602 <0.001 27.073 14.388 50.940 
第 2 步 常数 项 -4.647 0.422 121.502 <0.001 0.010 
服药 情况 2.309 0.355 42.174 <0.001 10.060 5.012 20.192 
治疗 11 周 2.684 0310 74.842 <0.001 14.638 7.970 26.887 
条 记 治疗 21 周 4761 0.444 114.981 <0.001 116.863 48.949 279.006 
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第 二 节 条件 logistic 回归 


一 、 条 件 logistic 回归 的 原理 


在 医学 研究 的 设计 阶段 ,采用 配对 设计 来 控制 混杂 因素 对 研究 结果 的 影响 是 常用 的 方 
法 。 如 把 病例 和 对 照 按照 年 龄 .性别 等 条 件 进行 匹配 , 形成 多 个 匹配 组 。 条 件 logistic 回归 
(conditional logistic regression ) 是 针对 配对 或 分 层 资料 的 一 种 分 析 方 法 。 在 这 类 资料 中 , 每 一 个 
病例 配 以 条 件 相 似 的 一 个 (1: 1) 或 几 个 (1: M, 通常 M<3) 对 照 ,形成 一 个 匹配 组 ( 层 ), 称 为 1:1 
配对 或 1: M 配 对。 条 件 logistic 回归 与 非 条 件 logistic 回归 的 区 别 是 参数 估计 是 否 用 到 了 条 件 
概率 。 

设 有 个 病例 , 每 个 病例 配 以 条 件 相似 的 M 个 对 照 , 共 形 成 个 匹配 组 ,数据 格式 如 表 13-8 
所 示 。Y=1 为 病例 , 组 内 编号 为 0; Y= 0 为 对 照 ,组 内 编号 1-M; X, 表示 第 i 个 匹配 组 第 :(1=0， 
1,2,…, M) 个 观察 对 象 的 第 j 个 危险 因素 的 观察 值 。 | 


表 13-8 1:M 条 件 logistic 回归 数据 的 格式 








匹配 组 号 组 内 编号 反应 变量 危险 因素 
yi t 学 DC Xe SE »》 
i 0 1 Xo Xo a Xlom 
1 0 Xn Xi ep Xim 
有 0 Xa Xz Kam 
M 0 Xn Kip Am 
n 0 Wy 其 态 Hrom 
1 Xn ez Xnim 
2 0 Xa pg oam 
M 0 Xnan Xan es Kram 





* 1=0 为 病例 , 其 他 为 对 照 


用 P 表 示 第 i 层 在 一 组 危险 因素 作用 下 发 病 的 概率 , 条 件 logistic 模型 可 表示 为 
1 
1+ exp[ 一 (Pu +pBX,+ PX, + +p,X,)] : 
bo 表示 各 层 的 效应 ,Bi, PB,,… ,pn, 为 待 估计 的 参数 。 与 非 条 件 logistic 回归 模型 不 同 之 处 在 常数 
项 上 ,不 同 匹 配 组 的 pu 可 以 各 不 相同 ,但 内 在 假定 了 每 个 危险 因素 的 致 病 能 力 在 不 同 匹配 组 中 
相同 。 、 
条 件 似 然 函 数 的 构造 : 用 =(Xin, Xio，,… ,六 。,) 表 示 第 i 层 内 第 1 个 观察 对 象 危险 因素 的 观 
察 向 量 值 , 考虑 第 i 个 匹配 组 中 的 M+1 个 观察 对 象 有 1 名 病例 的 条 件 下 ,恰好 第 一 个 观察 对 象 
属于 病例 组 的 条 件 概率 为 





i 


j=1, 2, i (13-14) 


Mf 
PX Y=D] TP Y=0) 
所 ‘= 


M MM 
ee, lIY=D I zcx ,17= oj 


=0 1=0 1#1 





(13-15) 
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它 等 于 观察 到 的 第 一 组 危险 因素 属于 病例 而 其 他 危险 因素 属于 对 照 的 概率 与 各 种 可 能 组 合 情 
况 下 的 概率 的 比值 。 利 用 概率 论 中 的 条 件 概率 公式 和 式 (13-14) 有 
1 





性 (13-16) 
1+ eb Co 一 zj 
为 了 估计 模型 的 参数 , 构造 综合 n 个 匹配 组 的 条 件 似 然 函 数 为 
5 II , (13-17) 


L M m 
uF by BK,— xz 
1=1 7=1 


可 以 看 出 , 条件 logistic 回归 分 析 只 估计 了 表示 危险 因素 作用 的 p 值 , 表示 匹配 组 效应 的 常数 项 
pv 则 被 自动 地 消去 了 。 

对 上 述 条 件 似 然 函数 工 取 自然 对 数 后 , 用 非 线性 选 代 法 求 出 参数 的 估计 值 忆 = 1, 2，…, 六 ) 
及 其 标准 误 5,,。 回 归 系数 的 假设 检验 及 分 析 方 法 与 非 条 件 logistic 回归 完全 相同 。 实 际 中 ,上 
述 计算 过 程 可 以 简化 , 直接 由 统计 软件 给 出 参数 估计 和 假设 检验 的 结果 。 


二 .应 用 实例 


例 13-3 ”上 海 某 大 学 研究 人 员 做 了 胃癌 1:1 配对 设计 的 病例 - 对 照 研究 , 本 例 节录 了 其 中 
40 对 资料 , 见 表 13-9 和 表 13-10, 试 筛选 胃癌 发 病 的 危险 因素 。 





表 13-9 胃癌 可 能 危险 因素 编码 表 











因素 变量 名 编码 说 明 
接触 有 害 物 质 4 无 =0, 有 =1 
蛋白 质 摄 人 量 分 级 办 0,1,2,3,4,5( 无 =0, 摄 入 量 逐 级 升 高 ) 
新 鲜 蔬 菜 及 水 果 摄 人 为 无 =0, 少 =1, 多 =2 
喜 盐 渍 食物 及 重 盐 饮 食 2 0,1,2,3,4,5( 不 吃 =0, 喜 好 程度 逐 级 升 高 ) 
不 良 饮食 习惯 故 0,1,2,3,4( 无 =0, 数 量 逐 级 升 高 ) 
吸烟 A 吸烟 量 分 x 吸烟 年 数 分 级 
精神 因素 芳 0, 1,2, 3( 分 值 越 高 负面 精神 因素 越 多 ) 
胃癌 这 对 照 =0, 胃癌 =1 





表 13-10 胃癌 危险 因素 研究 1:1 病例 -对 照 研究 数据 表 








序号 配对 编号 Xi Xz Xa X4 Xs Xe Xr Y 
lL 1 1 2 2 0 0 3.00 元 1 
2 1 0 1 1 1 2 0.50 0 0 
3 2 1 2 2 1 3 0.25 区 1 
4 2 0 3 a 0 1 0.25 0 0 
5 3 1 1 1 1 » 0.00 3 1 
6 3 0 2 1 0 2 0.00 0 0 
7 4 1 1 1 0 3 0.75 0 1 
8 4 0 2 1 0 1 0.00 0 0 
9 条 1 0 1 0 0 2.00 1 1 
10 5 0 1 1 0 1 0.00 0 0 
11 6 1 2 1 3 2 2.00 这 1 
12 6 0 4 1 0 0 2.00 0 0 
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xX 


Xs 


Xs 


xX 


Xs 


Xe 





0.00 
0.00 
1.00 
0.00 
0.00 
0.00 
0.00 
2.00 
1.50 
0.00 
0.00 
1.50 
1.00 
2.00 
0.25 
1.00 
0.00 
0.00 
0.50 
0.00 
0.00 
0.75 
0.00 
0.00 


0.25 


13 
14 
1 
16 
17 
18 
19 
20 
21 


qq 


CN 


CO 


上 


10 
10 
11 
11 


[| 


mm 


22 
23 


12 
13 
13 
14 


24 
25 


26 
2 


qq 


14 
15 
15 


28 


[el 


29 
30 
31 


bel 


16 
16 
Lx 
17 
18 
18 
19 
19 
20 
20 
21 


32 
33 
34 
35 


[a] 


36 
7 


0.00 
2.00 
1.00 
1.50 


2.00 


38 


39 


41 


a4 


42 


22 


43 


0.00 


22 
23 


mn 


45 


0.00 
4.00 
0.00 


2.00 


23 


46 


0 


24 
24 
25 


47 


qq 


48 


0 


49 
50 
51 


1.00 
0.75 


0.00 


25 


26 
26 
好 


0 


52 
53 


0.00 
0.00 
0.00 


(a) 


27 
28 


54 
55 


0 


56 
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| 续 表 
| 序号 配对 编号 Xi Xe Xs Xs Xs 3 xX; Y 
| 57 29 0 1 1 1 2 3.00 1 1 
| 58 29 0 2 1 0 1 1.50 1 0 
59 30 0 0 L 0 2 0.50 1 1 
60 30 0 1 1 0 0 0.00 0 0 
| 61 | 0 1 1 0 3 0.25 0 1 
| 62 31 0 2 1 0 2 0.00 0 0 
63 32 0 1 2 0 0 0.00 0 1 
64 32 0 2 2 0 0 0.50 0 0 
65 33 0 0 1 1 3 2.00 2 1 
66 33 0 1 1 2 0 0.00 0 0 
| 67 34 0 0 1 0 2 0.00 2 1 
68 34 0 1 1 2 1 0.00 0 0 
69 35 0 六 1 0 人 0.00 2 1 
| 70 35 0 3 2 0 1 0.00 0 0 
| 71 36 0 1 1 0 0 0.25 0 1 
| 7 36 0 3 1 1 1 0.00 0 0 
73 37 0 3 1 0 2 1.00 0 1 
74 yl 0 革 2 0 1 0.50 0 0 
75 38 0 2 1 1 2 0.00 0 1 
76 38 0 4 2 3 1 0.00 0 0 
77 39 0 1 1 0 3 0.25 0 
78 39 1 1 T 0 1 0.25 0 0 
79 40 0 1 1 2 2 0.00 1 1 
80 40 1 4 1 0 4 0.00 0 0 





借助 SPSS 软件 进行 变量 筛选 , 采用 向 后 选择 法 (Wald 检验 ), 得 到 表 13-11 的 变量 筛选 结果 。 
在 诸多 危险 因素 中 , 不 良 饮食 习惯 和 精神 因素 具有 统计 学 意义 , 提示 在 防治 胃癌 的 工作 中 应 1 
视 养 成 良好 的 饮食 习惯 , 注意 精神 因素 的 调节 , 戒除 不 良 哮 好 。 


表 13-11 例 13-3 胃癌 危险 因素 条 件 logistic 回归 筛选 结果 











因素 回归 系数 ”标准 误 waldzz ”PpP 什 OR 什 _OR 值 95% 可 信 区 间 
x b Sp 下 限 上 限 
识 盐 渍 食物 及 重 盐 饮食 。 0.404 0.286 1.986 0.159 1.497 0.854 2.625 
| 不良 饮食 习惯 0.881 0.368 5.742 0.017 2.414 1.174 4.964 
吸烟 0.832 0.495 2.820 0.093 2.297 0.870 6.062 
精神 因素 1.151 0.560 4.230 0.040 3.162 1.056 9.471 





第 三 节 logistic 回归 应 用 及 注意 事项 


1. logistic 回归 分 析 的 应 用 logistic 加 上 了 分 析 可 以 用 于 流 A 学 临床 试验 数据 分 析 、 We 
或 毒物 的 剂量 反应 和 预测 与 判别 等 多 个 方面 。 在 流行 病 学 研究 上 , 可 以 通过 得 到 某 一 因素 
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回归 系数 b, 估计 出 这 一 因素 在 不 同 水 平 下 的 比 数 比 或 近似 相对 危险 度 。 在 临床 试验 数据 分 析 


上 , 目的 是 为 了 评价 某 种 药物 或 治疗 方法 的 效果 , 如 果 有 其 他 影响 效果 的 非 处 理 因素 (如 年 龄 
病情 等 ) 在 试验 组 和 对 照 组 中 分 布 不 均衡 , 就 有 可 能 夸大 或 挖 盖 试验 组 的 治疗 效果 ,利用 logistic 
回归 分 析 能 够 得 到 调整 后 的 药物 评价 结果 , 使 结果 更 加 准确 。 在 分 析 药物 或 毒物 的 剂量 反应 
上 , 如 果 药物 或 毒物 有 多 种 , 可 以 利用 logistic 模型 做 它们 的 联合 作用 分 析 , 说 明 药物 间 的 协同 
或 持 抗 作用 。 在 预测 与 判别 上 , 可 以 利用 这 一 模型 预测 某 事件 发 生 的 概率 。 

2. 变量 的 取 值 “与 线性 回归 问题 类 似 , 作 logistic 回归 分 析 时 也 需要 考虑 变量 的 数量 化 方 
法 。 对 同一 资料 的 分 析 , 变量 采用 不 同 的 取 值 形式 , 参数 的 含义 、 量 值 、 符 号 及 假设 检验 结果 者 
可 能 发 生变 化 。 

实际 应 用 中 , 如 果 自 变量 是 二 分 类 定性 变量 , 可 以 使 用 0 或 1 编码 ; 如 果 是 多 分 类 则 需要 化 
吓 变 量 的 方法 。 当 自 变量 是 一 个 定量 指标 时 , 有 三 种 处 理 方法 : 第 一 种 方法 , 直接 使 用 原始 观测 
值 。 此 法 用 起 来 比较 简单 ,能 够 保持 信息 的 完整 性 , 在 许多 情况 下 回归 效果 也 较为 理想 , 假设 检 
验 的 结果 也 比较 可 靠 , 但 这 种 方法 参数 的 实际 意义 不 够 明确 , 如 年 龄 增加 1 岁 的 相对 危险 度 可 能 
没有 实际 意义 。 第 二 种 方法 ,将 连续 变量 按 取 值 区 间 分 成 若干 等 级 组 , 按 1,2,…,&8 给 分 ,然后 
按 连续 变量 进行 处 理 。 第 三 种 方法 ,将 连续 变量 按 不 同 区 间 分 成 个 组 后 , 化 作 g 一 1 个 哑 变 量 
处 理 , 使 用 这 种 方法 的 关键 是 要 正确 地 分 组 ,赋值 方法 见 表 13-12。 需 要 注意 的 是 , 当 8> 2 时 ， 
不 能 用 常规 的 方法 进行 变量 筛选 , 而 应 将 g- 1 个 哑 变 量 作为 一 个 整体 ,检验 其 是 否 引入 回归 
模型 。 











表 13-12 年 龄 变量 离散 化 处 理 的 赋值 方法 














年 龄 ( 岁 ) 等 级 变量 三 变量 
x G 54 2 xX 
<40 1 0 0 0 
40~ 学 1 0 0 
50~ 3 0 1 0 
60~ 4 0 0 1 




















3. 样本 含量 logistie 回归 的 所 有 统计 推断 都 是 建立 在 大 样本 基础 上 的 , 因此 其 应 用 的 一 
个 基本 条 件 是 要 求 有 足够 的 样本 含量 , 样本 含量 愈 大 分 析 结果 愈 可 靠 。 实 际 中 病例 和 对 照 的 人 
数 应 至 少 各 有 30~50 例 ,方程 中 的 变量 个 数 愈 多 需要 的 例 数 也 就 愈 大 。 对 于 配对 资料 , 一 般 样 
本 的 匹配 组 数 应 为 纳入 方程 中 的 自 变量 个 数 的 20 倍 以 上 。 

4. 变量 间 的 交互 作用 ” 当 某 一 自 变量 对 应 变量 了 的 作用 大 小 与 男 一 个 自 变量 的 取 值 有 关 
时 , 则 表示 两 个 自 变 量 有 交互 作用 。 回 归 模 型 中 是 否 要 考虑 交互 作用 主要 靠 专 业 知识 。 为 了 检 
验 两 个 自 变量 是 否 具有 交互 作用 ,普遍 的 做 法 是 在 方程 中 加 入 它们 的 乘积 项 。 如 对 表 13-6 数 
据 的 分 析 , 已 经 选 出 是 否 用 药 (各)、 治 疗 周 数 (XX,) 两 个 变量 显著 , 如 果 在 方程 中 加 入 骨折 类 型 
( 角 )、 治 疗 方法 (名 ) 和 2Z=% 名 项 ,结果 Z 显 著 (P=0.0088), 说 明治 疗 方法 和 骨折 类 型 之 间 有 交 
互 作用 。 

5. 多 分 类 logistic 回归 ” 当 应 变量 了 是 一 个 多 项 分 类 指标 , 特别 是 有 序 分 类 指标 时 , 如 流行 
病 学 中 一 些 慢性 病 的 危险 因素 研究 , 观察 结果 为 “无 、 轻 ,中 、 重 ”; 临床 试验 的 疗效 评价 , 结果 为 
“治愈 ,显效 、 好 转 、 无 效 ”; 临床 影像 诊断 按 上、+、++H" 不 同等 级 进行 分 类 的 资料 , 均 可 以 采 
用 logistic 回归 模型 进行 分 析 。 有 序 logistic 模型 除 参数 模型 的 意义 略 有 差别 外 , 在 使 用 上 可 以 
完全 按照 二 分 类 logistic 回归 模型 分 析 方法 进行 。 
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起 


ul 


练习 题 
一 、 单 项 选择 题 
回归 分 析 适 用 于 应 变量 为 ( ) 
类 变量 资料 B. 连续 型 的 计量 资料 
C. 正 坊 分 布 资料 D. 正 偏 态 分 布 资料 


.logistic 回归 模型 中 自 变量 不 可 以 直接 使 用 的 是 ( ) 





ms B. 连续 型 的 计量 
C. 无 序 多 分 类 变量 汪 丰 谷类 实生 


E. 两 端 无 确定 数值 的 变量 

条 件 logistic 回归 与 非 条 件 logistic 回归 的 主要 差别 是 ( ) 

A. 非 条 件 logistic 回归 没有 任何 假定 条 件 。 B. 回归 系数 的 意义 不 同 

C. 参数 估计 的 似 然 函数 不 同 D. 假设 检验 使 用 的 统计 量 不 同 
E. 条 件 logistic 回归 要 求 应 变量 服从 正 态 分 布 


. 欲 研究 糖尿 滴 与 年 龄 、 高 血压 和 肥胖 之 间 的 关系 ,不 可 以 采用 的 检验 统计 量 是 ( ) 


A. Wald 检验 统计 量 B. 似 然 比 检验 统计 量 
C. 计 分 检验 统计 量 D. 方差 分 析 瓦 检验 统计 量 
E. 卡 方 检验 统计 量 


.logistic 回归 分 析 不 适合 应 用 的 是 ( ) 


A. 是 否 发 生 疾 病 的 预测 B. 慢性 病 的 危险 因素 分 析 
C. 估计 近似 相对 危险 度 D. 多 种 药物 的 联合 作用 
E. 传染 病 的 危险 因素 分 析 

logistic 回归 系数 户 的 流行 病 学 意义 是 ( ) 

A. 比 数 比 OR 值 B. 相对 危险 度 RR 值 

C， OR 值 的 自然 对 数值 D. RR 值 的 自然 对 数 

E. 发 病 牵 尸 的 改变 量 

下 列 资 料 适合 作 logistic 回归 分 析 的 是 ( ) 

A. 身高 与 体重 的 关系 B. 冠 心 病危 险 因 素 的 筛选 


C. 传染 病 发 病 概 率 的 估计 D. 男性 与 女性 肺癌 发 病 率 的 比较 

E. 不 同 剂量 高 血压 药物 的 作用 

在 500 名 病例 与 500 名 对 照 的 匹配 病例 对 照 研究 中 , 有 400 名 病例 与 100 名 对 照 有 暴露 
史 。 根 据 此 资料 , 可 以 计算 出 比 数 比 OR 为 ( ) 


A. 4 B20 C18 BD: 10 E. 16 
,logistic 回归 分 析 , 判断 自 变 量 对 应 变量 作用 大 小 应 采用 的 统计 量 是 ( ) 

A. Wald 卡 方 值 B. 标准 回归 系数 

C. 似 然 比值 D. 回归 系数 

E. 1 值 


10. 一 项 研究 食管 癌 与 吸烟 、 饮 酒 危 险 因素 关系 的 数据 分 析 结 果 表 明 , 吸烟 与 不 吸烟 的 比 


数 比 OR,=2.42, 饮酒 与 不 饮酒 的 比 数 比 OR1=1.69, 则 同时 吸烟 和 饮酒 与 两 者 强 无 的 
比 数 比 OR 值 为 (”) 








第 十 三 章 logistic 回归 分 析 





A 409 B. 2.42 
© 169 Dl 
E.. (73 


二 、 计 算 与 分 析 
1. 茶 研 究 者 欲 比较 三 种 不 同 药 物 治疗 某 病 的 疗效 ,病情 是 疗效 的 一 个 影响 因素 ,经 研 
究 得 到 数据 如 下 表 所 示 , 试用 logistic 回归 进行 分 析 。 


三 种 药物 治疗 不 同 病 情 的 某 病 疗效 








药物 病情 有 效 无 效 
由 药 轻 38 64 
重 10 82 
乙 药 轻 95 18 
重 50 35 
丙 药 轻 88 26 
重 43 37 





2. 茶 医 师 为 了 探讨 心肌 炎 发 生 的 有 关 危 险 因素 ,对 30 例 心肌 类 病人 和 30 例 健康 对 照 
者 进行 病例 - 对 照 研 究 , 指标 赋值 及 数据 如 下 两 表 所 示 , 试用 logistic 回归 筛选 危险 因素 。 


心肌 炎 可 能 危险 因素 赋值 表 








因素 变量 名 编码 说 明 
年 龄 ( 岁 ) 区 <40=1, 40~49=2, 50~59=3, 60~-=4 
高 血压 中 站 无 =0, 有 =1 
高 血压 家 族 史 所 无 =0, 有 =1 
吸烟 站 不 吸 =0, 吸 =1 
蒋 血 脂 史 大 无 =0, 有 =1 
动物 脂肪 摄 入 低 =0, 高 =1 
体质 指数 a <24=1,24~=2,26~=3 
心肌 炎 对 照 =0, 病 例 =1 





心肌 炎 危 险 因素 病例 - 对照 研 究 数据 表 








序号 加 有 
1 和 下 
2 310 1 0 wo om ON 
3 2 ME I 
4 3 0 0 1 .0 Om 0 0 
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7 3 
8 2 0 0 0 0 wo TI OP TO 
9 1 和 二 二 
10 1 i © © 0 Po 

11 1 0 00 有 和 2 0 区 世 和 让 五 全 1 

妃 2 0 0 0 vo wo 0 ud 
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二 年 


让 
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25 
26 


27 


28 
29 
30 
31 
32 
33 
34 
35 


37 
38 


39 
40 
41 

















0 
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张 疹 瑞 ) 
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X2 
0 
0 
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表示 肥胖 患 病 情况 : 
数据 见 下 表 , 试 采用 适 
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血压 ;XY 
Xi 
0 
0 








EE 


= 各 





糖尿 病 


血压 ,1 
10 
11 
12 
13 
14 
15 


对 照 ,1 
配对 编号 


音 


而 





无 


0= 正常 ,1= 肥胖 ;了 表示 糖尿 病 串 病情 况 :0 








病情 况 :0 


病例 


血压 和 肥胖 与 糖尿 病 关 系 的 1:1 配 对 病例 -对照 研 究 数据 表 
Xe 


0 


[el 





设 系 表示 高 血压 


3. 为 了 研究 高 血压 和 肥胖 与 糖尿 病 的 关系 , 某 研究 按 1:1 配对 收集 了 15 对 病人 和 对 





10 
12 
13 
14 
15 


的 资料 





配对 编号 
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在 临床 试验 研究 中 ,如 对 慢性 病 、 恶 性 肿 冶 等 患者 的 随访 观察 ,常常 需 记录 观察 对 象 各 时 
点 上 终点 事件 的 发 生 情 况 , 包括 终点 事件 出 现 以 及 观察 对 象 达到 终点 所 经 历 的 时 间 长 短 , 以 比 
较 和 评价 临床 疗效 。 生 存 分 析 (survival analysis ) 就 是 将 事件 的 终点 和 出 现 这 一 终点 所 经 历 的 时 
间 结 合 起 来 分 析 的 一 类 统计 分 析 方法 。 本 章 内 容 主要 包括 生存 分 析 的 基本 概念 、 生 存 率 曲线 和 
Cox 回归 , 学 习 这 些 方法 的 目的 在 于 能 够 合理 地 描述 、 分 析 和 评价 生存 资料 。 








第 一 节 ”生存 分 析 的 基本 概念 


一 、 生 存 数据 及 其 特点 


1. 生存 时 间 ” 指 患者 从 发 病 到 死亡 所 经 历 的 时 间 长 度 。 广 义 上 , 生存 时 间 (survival time ) 
可 定义 为 从 规定 的 观察 起 点 到 某 终点 事件 出 现 所 经 历 的 时 间 长 度 , 观察 起 点 可 以 是 发 病 时 间 、 
第 一 次 确诊 时 间或 接受 处 理 (治疗 ) 的 时 间 等 , 终点 事件 可 以 是 某 种 疾病 的 发 生 、 复 发 或 死亡 、 
某 种 处 理 的 反应 等 。 例 如 , 在 临床 研究 中 , 急性 白血病 患者 从 骨 和 髓 移植 治疗 开始 到 复发 为 止 之 
间 的 时 间 间 隔 , 冠 心病 患者 出 现 心肌 梗死 所 经 历 的 时 间 ; 在 流行 病 学 研究 中 , 从 开始 接触 某 危 
险 因 素 到 发 病 所 经 历 的 时 间 ; 在 动物 实验 研究 中 , 从 开始 给 药 到 发 生死 亡 所 经 历 的 时 间 等 。 在 
计算 生存 时 间 时 , 为 便于 分 析 和 比较 , 需要 有 明确 规定 的 时 间 起 点 和 终点 以 及 时 间 的 测量 单位 。 
例 14-1 给 出 了 一 个 记录 乳腺 癌 患 者 从 手术 到 复发 的 生存 时 间 数 据 。 

例 14-1 为 了 解 乳腺 癌 患 者 手术 后 的 复发 情况 , 某 研究 者 对 某 医 院 1999 一 2009 年 间 的 乳 
腺 癌 手 术 上 患者 进行 了 随访 研究 。 随 访 起 始 时 间 为 1999 年 1 月 1 日 ,截止 时 间 为 2009 年 5 月 31 
日 。 以 手术 时 间 为 观察 起 点 , 直至 患者 出 现 复发 (status=1 为 复发 , 0 为 删 失 ), 并 记录 每 个 研究 
对 象 的 年 龄 (age, 岁 )、 病 理 类 型 (type=1 为 浸润 性 非特 殊 癌 , 2 为 其 他 )、 淋 巴结 转移 (node=1 为 
有 , 0 为 无 ) 肿瘤 直 径 (size= 1 为 <2cm, 2 为 2~5cm, 3 为 >5cm), 生存 时 间 (time, 月 ), 摘 取 其 中 
7 例 随访 记录 见 表 14-1。 








表 14-1 乳腺 癌 患 者 生存 资料 原始 记录 表 








编号 age type node size start end time status 
1 56 1 0 ;1 2003-09-06 2004-05-19 8 1 
2 32 1 1 有 2006-02-09 2008-02-01 24 
3 81 2 0 2 2006-02-17 2009-04-24 38 , 
4 44 2 0 1 2003-09-30 2009-04-25 67 1 
3 32 1 1 2005-12-22 2008-07-01 30 0 
6 35 1 1 2001-07-20 2003-07-21 24 0 
名 40 0 3 2003-07-25 2004-11-15 15 0 





2. 生存 数据 ”生存 数据 (survival data ) 包 括 完全 数据 (complete data ) 和 删 失 数 据 (censored 
data )。 完 全 数据 提供 的 是 准确 的 生存 时 间 , 如 例 14-1 中 1~4 号 患者 的 生存 时 间 均 为 完全 数据 。 
删 失 数据 也 称 截 尾数 据 , 是 由 于 某 种 原因 而 无 法 准确 观测 到 生存 时 间 的 数据 , 如 5~7 号 患者 的 
生存 时 间 为 删 失 数据 。 
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产生 删 失 数据 的 主要 原因 有 :@ 研 究 结束 时 终点 事件 尚未 发 生 , 如 网 14-1 中 的 第 4 号 观察 
对 象 , 在 研究 计划 规定 的 随访 时 间 时 仍 未 发 生死 亡 事件 ; @ 失 访 , 即 由 于 观察 对 象 搬迁 等 原 
而 未 观察 到 终点 ,如 图 14-1 中 的 第 3 号 观察 对 象 ; 图 研究 对 象 因 死 于 其 他 原因 或 严重 世 
而 终止 试验 和 观察 。 

删 失 数据 的 表示 方法 : 为 区 别 于 完全 数据 , 常 在 删 失 数 据 右上 角 标 记 “+" 
时 间 未 知 , 只 知道 其 生存 期 比 观察 到 的 删 失 时 间 要 长 。 如 例 14-1 中 2 号 号 砷 省 的 生 站 
6 号 患者 的 生存 时 间 为 24*。 虽 然 删 失 数 据 所 提供 的 生存 时 间 信 息 不 完全 ,但 这 类 数据 还 是 
提供 了 部 分 信息 , 即 说 明 观 察 对 象 至 少 在 已 经 经 历 的 时 间 长 度 内 设 有 发 生 终点 时 间 ， 因此 ,对 
于 删 失 数据 , 既 不 能 随意 弃 之 , 又 不 能 同 完全 数据 那样 对 待 , 这 就 需要 采取 专门 处 理 这 种 资料 
的 统计 方法 即 生存 分 析 。 

图 14-1 为 随访 研究 中 常见 的 生存 时 间 原 始 记录 示意 图 , 图 中 “x" 表示 终点 事件 “死亡 ”,“O” 
表示 失 访 、 退 出 研究 或 死 于 与 本 研究 无 关 的 其 他 原因 。 以 开始 治疗 为 起 始 事件 , 观察 对 象 1、5 
号 在 规定 的 观察 期 间 内 发 生 了 死亡 , 其 生存 时 间 为 完全 数据 ; 观察 对 象 2 号 是 在 观察 终点 之 后 
才 发 生死 亡 事件 ,3 号 和 4 号 分 别 为 失 访 和 研究 结束 时 尚未 发 生死 亡 , 则 这 3 名 观察 对 象 的 生存 
时 间 为 删 失 数据 。 





























wm wb 
O 〇 





起 始点 终点 ”时 间 
图 14-1 生存 时 间 原 始 记录 示意 图 


归纳 生存 数据 的 主要 特点 , 即 同 时 考虑 生存 结局 和 生存 时 间 、 并且 可 能 含有 出 失 数据 , 生 
存 时 间 通 常 不 服从 正 态 分 布 。 
一、 生存 分 析 和 常用 统计 指标 
存 率 ”生存 率 (survival rate ) 又 称 生 存 国 数 (survival function )， 表示 观察 对 象 的 生存 时 
间 es 某 时 刻 1 的 概率 ,常用 S(t) 表 示 , 其 估计 值 为 


1 时 刻 仍 存活 的 例 数 ge 
一 观察 总 例 数 (14-1. 





SCD)= PT7>D= 


上 式 是 无 删 失 数据 时 估计 生存 率 的 公式 , 若 含 有 删 失 数据 , 则 需要 分 时 段 计 算 牛 存 概率 。 假 定 
观察 对 象 在 各 个 时 段 的 生存 事件 独立 , 5(7) 的 估计 公式 为 
S(1)=P(T>4)=pip2**pr=S( li)pr (14-2 
式 中 p(i=1,2,…,) 为 各 分 时 段 的 生存 概率 ， 故 生 存 率 又 称 累积 生 存 概率 (cumulative probability 
of survival ), 

2. 中 位 生存 期 50% 的 个 体 尚 存活 的 时 间 称 为 ' 位 生存 期 (median survival time ), 又 称 作 
半数 生存 期 ， 中 位 生存 期 越 长 , 表示 疾病 的 预后 越 好 ; 反之 , 中 位 生存 期 越 短 , 预后 越 益 ， 中 位 
生存 期 可 以 根据 生存 率 曲线 得 到 , 生存 曲线 纵 轴 生存 率 为 50% 时 所 对 应 的 横 轴 生存 时 间 即 千 
位 生存 期 。 
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3. 风险 函数 ”和牛 en heedede te dee 
function), 又 称 为 危险 4 数 . 常用 有 (1) 表示 , 即 
PLU<T<It+At|T¥7) 

Ar 
当 At=1 时 ,hh(7)=P(1<T<t+ 117=7), 即 h(t) 近 似 等 于 1 时 刻 存活 的 个 体 在 此 后 一 个 单位 时 段 内 
的 死亡 概 次 

风险 函数 随时 间 的 延长 可 呈现 递增 、 递 减 或 其 他 波动 形式 , 当 风险 函数 为 常数 时 , 表示 死 

亡 速 深 不 随时 间 而 加 速 ,如果 风险 函数 随时 间 上 升 , 则 表示 死亡 速率 随时 间 而 加 速 ,反之 亦 然 。 











AD = lim (14-3 ) 
0 


第 二 节 ”生存 率 曲线 及 比较 


生存 率 的 合计 方法 有 非 参 数 法 和 参数 法 。 在 非 参 数 方 法 中 又 分 为 寿命 表 法 和 Kaplan-Meier 
法 (K-M 法 , 也 称 乘积 极限 法 ), 二 者 均 应 用 定 群 寿命 表 的 基本 原理 , 先 求 出 各 个 时 段 的 生存 概 
率 , 然后 根据 概率 乘法 定理 计算 生存 率 , 但 前 者 往往 适用 于 大 样本 资料 , 对 于 小 样本 或 大 样本 
且 有 精确 生存 时 间 的 资料 一 般 采 用 Kaplan-Meier 法 ， 本 节 介 绍 Kaplan-Meier 法 & 





一 、Kaplan-Meier 生存 率 曲 线 
(一 ) 计算 生存 率 
Kaplan-Meier 生存 率 曲 线 由 Kaplan 和 Meier 于 1958 年 首先 提出 ， 它 是 一 种 估计 生存 率 的 
参数 方法 。 
例 14-2。” 某 研究 者 收集 了 15 例 乳 腺 恶性 肿瘤 直径 小 于 或 等 于 2cm 的 患者 和 21 例 肿 痛 
径 大 于 5em 患者 手术 后 的 生存 资料 , 定义 从 手术 后 到 患者 复发 的 时 间 为 生存 时 间 ( 月 ), 试 估计 
两 组 的 复发 率 。 


污 





ke 





Wl 














肿瘤 直径 <2cm 10 10 13 项 957 .9 30 33 46 50- 54 
68 71 88” 95 
肿瘤 直径 > 5cm § 9 13 13 14 15 19 20 2 妈 24 





以 肿瘤 直径 <2cm 组 为 例 , 计算 步骤 如 下 : 

(1) 将 生存 时 间 (4) 由 小 到 大 顺序 排列 , 若 完全 数据 与 删 失 数据 相同 , 则 删 失 数据 排 在 完全 
数据 之 后 , 见 表 14-2 第 (2) 栏 。 

(2) 列 出 时 间 区 间 (z, tw) 上 的 复发 数 d 和 有 删 失 数 c, 见 表 14-2 第 (3)(4) 栏 。 

(3) 计算 恰 在 每 一 时 刻 4 之 前 的 生存 人 数 , 即 期 初 例 数 。 计 算 时 应 减 去 小 于 4 的 复发 数 和 
删 失 数 , 即 =ni1 一 di 一 ci1, 见 表 14-2 第 (5) 栏 。 

(4) 计算 各 时 间 区 间 上 的 复发 概率 g, 和 生存 概率 p,, 见 表 14-2 第 (6).(7) 栏 : 


1 
4 = pl (14-4) 


(5) 计算 生存 率 $Cz)。 活 过 某 时 刻 ! 的 生存 率 是 其 对 应 的 各 时 点 条 件 生存 率 的 连 乘积 , 即 
SU)= IIw = SC )p, (14-5) 


委 的 是 ,具有 朋 失 数据 的 条 件 死亡 率 为 0, 而 其 条 件 生存 率 必 为 1, 所 对 应 的 生存 率 必然 Ne 
与 前 一 个 非 肌 失 值 的 生存 率 相 同 。 各 患者 的 生存 率 见 表 14-2 第 (8) 栏 、 如 乳腺 肿瘤 小 十 等 于 元 人 
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2cm 患者 18 个 月 时 生存 率 为 0.862 x 0.917=0.790, 30 个 月 时 生存 率 为 0.711 x 0.889 = 0.632, 余 
(二 ) 计算 生存 率 的 标准 误 
Greenwood 生存 率 标准 误 近似 计算 公式 为 





SE[S(1)]=$0), |» j=1,2,.,i (C146 





如 





4 1 0 1 1 
党 十 十 十 
SVS 0790« [szds-5 14x(14-D) 13x(G13-1D 12x(2-D 





=0.108 


根据 上 述 计算 的 生存 率 及 其 标准 误 可 估计 总 体 生 存 率 的 可 信 区 间 。 其 方法 是 采用 正 态 分 
布 的 原理 , 用 下 式 来 进行 估计 。 
$1) +2,2SELSC)] (14-7) 
采用 该 式 时 , 生存 时 间 末 端 值 的 可 信和 区间 可 能 会 出 现 超出 [0, 1 ] 范 围 的 不 合理 情况 ， 此 时 可 采 
用 对 数 变换 的 方法 进行 计算 , 具体 详 见 相关 书籍 。 
表 14-2 乳腺 肿瘤 直径 <2cm 组 生存 率 计算 表 
序号 ”时间 (月 ) ”复发 数 ” 删 失 数 ”期 初 例 数 ”复发 概率 生存 概率 ” 生存 率 标准 误 








有 2 2 nn; 9 Pp SG) SE [$0)] 
(1) (2) (3) (4) (ON (TL (6) (8) (9) 
1 10 1 0 15 0.067 0.933 0.933 0.064 
2 10r* 0 1 14 0.000 1.000 0.933 0.064 
和 1 1 0 13 0.077 0.923 0.862 0.091 
家 je i 0 12 0.083 0.917 0.790 0.108 
5 25+ 0 1 11 0.000 1.000 0.790 0.108 
吕 29 1 0 10 0.100 0.900 0.711 0.123 
3 i 0 9 0.111 0.889 0.632 0.132 
| 8 33 0 8 0.125 0.875 0.553 0.137 
46 1 0 7 0.143 0.857 0.474 0.139 
10 50* 0 1 6 0.000 1.000 0.474 0.139 
11 54 1 0 5 0.200 0.800 0.379 0.140 
12 68+ 0 1 4 0.000 1.000 0.379 0.140 
| 13 71 1 0 薄 C333 0.667 0.253 0.139 
14 88* 0 1 人 0.000 1.000 0.253 0.139 
15 95+ 0 1 1 0.000 1.000 0.253 0.139 





(三 ) 绘制 生存 曲线 





| 以 随访 时 间 为 横 轴 , 生存 率 为 纵 轴 , 将 各 个 时 间 点 所 对 应 的 生存 率 连 接 起 来 的 一 条 曲线 即 
| 为 生存 曲线 。Kaplan-Meier 法 对 所 有 死亡 时 点 估计 生存 率 , 其 生存 率 曲 线 呈 阶梯 式 的 变化 。 则 
线 高 .下降 平 级 表示 高 生存 率 或 较 长 生存 期; 曲线 低 、 下 降 陡 峭 表示 低 生存 率 或 较 短 生 在 期 、 
图 14-2 为 肿瘤 小 于 或 等 于 2cm 和 肿瘤 大 于 5cm 组 (计算 表 略 ) 的 生存 曲线 , 结果 显示 前 者 的 生 
存 率 高 于 后 者 。 
生存 曲线 纵 轴 生存 率 为 50% 时 , 所 对 应 横 轴 生存 时 间 即 半数 生存 期 。 从 图 14-2 中 可 以 直 
观 地 看 出 肿瘤 大 于 5cm 组 的 半数 生存 期 大 约 为 23 个 月 。 


第 十 四 章 生存 分 析 








复发 时 间 ( 月 ) 
14-2 乳腺 肿瘤 <2cm 和 乳腺 肿瘤 >5cm 组 生存 曲线 


-、 生 存 率 的 比较 

两 组 或 多 组 生存 率 比较 是 生存 分 析 的 主要 内 容 之 一 。 生 存 率 组 间 比 较 实际 上 是 两 条 或 多 
条 生存 曲线 的 比较 。 生 存 率 的 假设 检验 方法 有 参数 法 和 非 参数 法 两 类 , 非 参数 法 对 资料 的 分 布 
没有 要 求 , 使 用 范围 较 广 ， 以 下 主要 介绍 非 参数 法 中 的 log-rank 检验 和 Breslow 检验 两 种 方法 。 

(一 ) log-rank 袜 验 

log-rank 检验 又 称 Mantel-Cox 检验 , 其 基本 思想 是 , 当 检验 假设 ( 即 比 较 组 间 生 存 率 相同 ) 
成 立时 , 根据 在 各 个 时 刻 尚 存活 的 患者 数 和 实际 死亡 数 计算 理论 死亡 数 , 然后 将 各 组 实际 死亡 
数 与 理论 死亡 数 进行 比较 , 其 检验 统计 量 为 


二 二 要 全 
1 ea (14-8) 


大 


式 中 di 和 Ti, 为 各 组 在 时 间 1 上 的 实际 死亡 数 和 理论 死亡 数 ,g 为 组 数 , 7=m /zi 第 下 组 的 方 


差 佑 计 值 为 
光 -生生 | 
二 区 n 作 nl 


检验 统计 量 刀 近似 服从 自由 度 v=g-1 的 妇 分 布 。 当 各 组 生存 率 相同 时 (已 为 真 ), 实际 死亡 数 
和 理论 死亡 数 较 接近 , 则 字 值 较 小 ,可 按 相应 自由 度 查 交界 值 表 得 到 P 值 ,作出 推断 结论 。 

例 14-3 ”根据 例 14-2 资料, 试 比较 两 种 不 同 肿瘤 直径 患者 术 后 的 生存 率 有 无 差别 ? 

分 析 步 又 如 下 : 

1. 建立 检验 假设 , 确定 检验 水 准 

Fo: Si(1)=S,(1), 即 两 种 不 同 肿瘤 直径 的 患者 术 后 生存 曲线 相同 

所 : S(t)#S(1), 即 两 种 不 同 肿瘤 直径 的 患者 术 后 生存 曲线 不 同 

a=0.05 

2. 计算 统计 量 邓 值 

(1) 时 间 排 序 : 将 两 组 生存 时 间 混 合 后 由 小 到 大 统一 排序 , 对 删 失 数据 的 处 理 同 前 。n、 
nz 分别 表示 两 组 观察 患者 数 ,n;= ni+ ni; dii、 dy; 分 别 表示 两 组 在 不 同时 间 点 上 的 复发 数 ， 
qd=qdiit+ dy cw、 cz 分 别 表示 两 组 在 不 同时 间 点 上 的 截 尾 例 数 。 计 算 结果 列 于 表 14-3 中 。 

(2) 计算 理论 数 及 其 方差 : 在 FH 成立 的 条 件 下 , 计算 各 组 理论 (期 望 ) 复 发 数 及 其 方差 。 如 
生存 时 间 为 5 个 月 时 ,肿瘤 <2cm 组 的 观察 人 数 为 15, 两 组 合计 观察 人 数 及 复发 人 数 分 别 为 36 


d. (14-9) 


i 
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表 14-3 ”两 种 肿瘤 直径 患者 术 后 生存 曲线 比较 的 log-rank 检验 计算 表 
序号 时间 (月 ) 肿瘤 <2cm 组 肿瘤 >5cm 组 合计 
i 去 m di en Ty Vi ny dy Cy 多 V, nm; d, 
(GR) (2) (300 (DCS C6 CSM) C11) (12) (13) (014 
| 1 5 15 0 0 0.417 0.243 21 1 0 0.583 0.243 36 1 
| 2 9 15 0 0 0.429 0.245 20 1 0 0.571 0.245 38 # 
3 10 15 1 0 0.441 0.247 19 0 0 0.559 0.247 34 1 
| 4 10 14 0 1 0.000 0.000 19 0 0 0.000 ”0.000 33 0 
Ee 13 13 1 0 0.813 0.467 19 1 0 1.188 0.467 32 2 
| 6 14 12 0 0 0.800 0.463 18 区 0 1.200 0.463 30 2 
2 15 12 0 0 0.429 0.245 16 1 0 0.571 0.245 28 1 
8 18 12 1 0 0.444 0.247 15 0 0 0.556 0.247 ZX 1 
| 9 19 11 0 0 0.423 0.244 15 1 0 0.577 0.244 26 1 
10 20 11 0 0 0.440 0.246 14 1 0 0.560 0.246 25 1 
11 21 fl 0 0 0.458 0.248 13 1 0 0.542 0.248 24 1 
12 2 11 0 0 0.478 0.250 12 1 0 0.522 0.250 23 1 
13 24 11 0 0 0.500 0.250 11 1 0 0.500 ”0.250 2 1 
14 25 11 0 二 0.524 0.249 10 1 0 0.476 0.249 21 1 
15 26 10 0 0 0.526 0.249 9 1 0 0.474 0.249 19 1 
16 27 10 0 0 0.556 0.247 8 1 0 0.444 0.247 18 1 
i 28 10 0 0 0.588 0.242 7 1 0 0.412 0.242 17 1 
18 29 10 1 0 0.625 0.234 6 0 0 0.375 0.234 16 L: 
19 30 9 1 0 0.600 0.240 6 0 0 0.400 ”0.240 15 1 
20 32 8 0 0 0.571 0.245 6 1 0 0.429 0.245 14 1 
刀 33 8 0 0.615 0.237 汪 0 0 0.385 0.237 13 1 
22 46 1 Ov O53 0 "5 oO 0G oa 0 Ww 1 
| 23 47 6 0 0 0.545 0.248 3 1 0 0.455 0.248 i 1 
24 50 6 0 lL 0.000 0.000 4 0 0 0.000 “0.000 10 0 
| 25 人 5 0 0 0.556 0.247 4 1 0 0.444 0.247 9 
26 54 5 1 0 1.250 0.402 3 1 0 0.750 0.402 8 2 
法 60 4 0 0 0.667 0.222 24 1 0 0.333 0.222 6 ti 
| 28 68 4 0 1 0.000 ”0.000 . 0 0 0.000 0.000 5 0 
29 gt 3 1 0 0.750 0.188 1 0 0 0250 0.188 4 1 
30 86 六 0 0 0.667 0.222 1 1 0 0.333 0.222 和 1 
31 88 人 地 1 0000 0000 0 0 0 0000 0.000 2 0 
32 95 1 0 1 0.000 “0.000 0 0 0 0.000 “0.000 1 0 
合计 一 一 9 6 15.695 7.110 ”一 21 0 14.305 7.110 ”一 30 





和 1, 则 其 理论 复发 数 和 方差 为 


| 15x1 15 ( 号 (3 
| a a 及 = x| 1 一 X 让 
外 











肿瘤 >5cm 组 的 理论 复发 数 和 方差 为 


21 Si Fd 
yo t= x1=0.243 
21 36 36 








36” 36—1 
笔记 其 余 类 推 , 结果 见 表 14-3 的 第 (6).(7) 和 (11)、(12) 栏 。 
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(3) 计算 统计 量 : 由 表 14-3 中 两 组 总 的 实际 复发 数 和 理论 复发 数 以 及 总 的 方差 估计 值 , 根 
据 式 (14-8), 按 肿瘤 <2cm 组 计算 得 到 统计 量 为 
过 (9 二 15.695)2 . 
7110 0 
同 理 , 或 按 肿 瘤 > Secm 组 计算 可 得 
3 (21 一 14.305) 
~ no 
3. 确定 概率 , 作出 统计 推论 查 儿 界 值 表 ( 附 表 7) 得 台 os.1=3.84, P<0.05, 按 a=0.05 水 准 ， 
拒绝 到, 接受 HH,, 可 认为 两 条 生存 曲线 不 同 , 肿瘤 直径 <2cm 患者 的 生存 率 高 于 肿瘤 直径 > Scm 
患者 。 
(二 ) Breslow 检验 
Breslow 检验 又 称 广义 Wilcoxon 检验 或 Gehan 比分 检验 ,好 统计 量 计 算 公 式 为 


和 [2 ,k=1,2,°,8 
式 中 ds、T 和 ;意义 同 前 ,g 为 组 数 , w; 为 权重 , Breslow 检验 取 wi;= ni(wi=1 时 为 log-rank 检 
验 )。 在 了 成 立 的 条 件 下 , 检验 统计 量 刀 近似 服从 自由 度 为 v=g-1 的 刀 分 布 。 如 对 例 14-2 资 
料 采 用 Breslow 检验 , 妇 =4.462, 忆 <0.05, 结论 同 log-rank 检验 。 

由 于 ni 随 生存 时 间 逐 渐 减 小 , 所 以 Breslow 检验 给 组 间 死 亡 的 近期 差别 更 大 的 权重 , 而 log- 
rank 检验 给 组 间 死 亡 的 远 期 差别 更 大 的 权重 , 即 前 者 对 近期 差异 敏感 , 而 后 者 对 远 期 差异 敏感 。 
另外 , 需要 注意 : 两 种 方法 的 应 用 条 件 相同 , 即 各 组 生存 曲线 呈 比 例 风险 关系 , 生存 曲线 不 能 
交叉 。 通 常情 况 , 在 生存 曲线 有 交叉 时 , 不 适合 做 生存 曲线 的 整体 比较 。 


=6.304 


(14-10) 








第 三 节 多 变量 Cox 回归 分 析 


前 述 方法 属于 单 变量 生存 分 析 方 法 。 在 多 变量 分 析 情 况 下 , 由 于 生存 分 析 中 的 应 变量 需要 
同时 考虑 生存 结局 和 生存 时 间 , 而 生存 时 间 不 服从 正 态 分 布 , 同时 可 能 含有 截 尾 数据 , 因此 多 
元 线性 回归 和 logistic 回归 都 不 适合 对 生存 数据 进行 多 因素 分 析 。 对 此 可 以 使 用 Cox 比例 风险 
回归 模型 (Cox proportional hazards regression model, PHREG ), 简称 Cox 模型 。 这 一 模型 由 英国 统 
计 学 家 D.R.Cox 于 1972 年 提出 , 在 医学 多 变量 生存 分 析 中 得 到 广泛 的 应 用 。 


一 、Cox 回归 模型 





(一 ) 模型 的 基本 形式 
Cox 回归 模型 可 以 表示 为 
h(t, X)=ho(t)exp(BX +PB Xs t+ BY,) (14-11) 
其 中 h(1,X) 为 观察 对 象 生存 到 1 时 刻 的 风险 函数 ;X=(X, 各,…, 和,) 是 可 能 与 生存 时 间 有 关 
的 mw 个 自 变 量 ; 加 (7) 为 各 = 为 =…= 加 ,=0 时 在 1 时 刻 的 风险 函数 , 称 为 基础 风险 函数 ; p=(p， 
民 ,…, Ba) 为 Cox 模型 的 回归 系数 ,是 一 组 待 估计 的 参数 。 
(二 ) 模型 参数 解释 及 相对 危险 度 计 算 
Cox 模型 经 过 简单 变换 , 可 以 写成 
[名 
hh 





]-Ar pete, (14-12) 








笔记 


| 
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Cox 模型 回归 系数 (j=1,2,…,m) 表 示 当 因素 及 改变 一 个 单位 时 ln[ h(1, 久 )/ ho(7)] 的 改 
变量 , 它 与 衡量 危险 因素 作用 大 小 的 风险 比 (hazard ratio, HR) 有 一 个 对 应 的 关系 。 

设 自 变量 思 的 两 个 不 同 取 值 为 六 =c, 和 为 =co, 假定 其 他 因素 的 水 平 相同 , 两 个 不 同 暴露 水 
平 久 =cl 和 名 =co 下 的 风险 比 HR 的 自然 对 数 为 


本 





| hCG,X) FF h(t, X)/ ht) 
ma -| 人 | bd 
-s+Bax]- (pntBpx | ly 
1#j 1#/ 
=p,(c— co) 
XX" 表示 另外 一 组 自 变量 取 值 。 取 反对 数 后 可 得 
HR,=exp[ Bi(c1—co)] (14-14) 
特殊 地 , 如 果 雹 赋值 为 1 或 0, 分 别 表示 暴露 和 非 暴露 两 个 水 平 , 则 其 风险 比 为 
HR,=exp(p;) (14-15) 


当 忆 =0 时 , HBRj=1, 说 明 恩 对 生存 时 间 不 起 作用 ; 当 记 >0 时 , HR>1, 说 明 及 是 一 个 危险 因素 ; 
当 p<0 时 , HR<1, 说 明 思 是 一 个 保护 因素 。 在 具体 研究 中 可 结合 % 所 代表 的 因素 对 其 做 出 
恰当 的 解释 。 

现 举 一 个 简单 例子 说 明 。 乳 腺 癌 患 者 手术 后 是 否 复发 的 时 间 与 是 否 化 疗 有 关 , 以 X=1 表 
示 接 受 化 疗 ,X=0 表示 未 进行 化 疗 , 得 到 六 的 回归 系数 B= 一 0.380, 则 接受 化 疗 患者 的 风险 为 

hi(1)=ho(t)exp(Bx)=ho(t)exp(—0.380x 1)=0.68ho(1) 
未 进行 化 疗 患 者 的 风险 为 
hs(1)=ho(t)exp(Px )=ho(t)exp(—0.380 x 0)=ho(7) 

两 者 的 风险 比 为 
_ hl, X=D) 
hl, X=0) 
即 接受 化 疗 的 患者 其 复发 风险 是 未 进行 化 疗 患 者 的 0.68 倍 ,或 未 进行 化 疗 的 患者 其 复发 风险 是 
接受 化 疗 患 者 的 1.47 倍 。 


HR =exp(~0.38)=0.68 


“、 模 型 的 参数 估计 及 其 假设 签 验 


由 于 式 (14-11 ) 对 (7) 未 作 任何 假定 , 所 以 不 能 用 普通 的 最 大 似 然 法 来 估计 回归 系数 5, 对 
此 可 以 构造 偏 似 然 函 数 (partial likelihood function ), 并 引用 最 大 似 然 法 进行 估计 。 

参数 检验 的 零 假设 为 所 : B=0。 与 logistic 回归 相似 , Cox 回归 常用 的 检验 方法 有 似 然 比 检 
验 、Wald 检验 和 Score 计 分 检验 。 三 种 检验 方法 均 为 好 检验 , 自由 度 为 模型 中 待 检验 的 参数 个 
数 。 具 体检 验方 法 及 变量 筛选 过 程 参见 第 十 三 章 。 


>、 忆 用 锯 例 


例 14-4 ”为 探讨 乳腺 癌 患 者 手术 治疗 的 预后 , 某 研究 者 收集 了 68 例 患 者 的 生存 时 间 、 生 存 
结局 及 影响 因素 。 影 响 因素 包括 患者 年 龄 .病理 分 型 、 淋 巴结 转移 .肿瘤 大 小 、 化 疗 .绝经 , 生存 
时 间 以 月 为 单位 。 变 量 的 赋值 和 收集 的 相应 资料 分 别 见 表 14-4 和 表 14-5。 

对 表 14-5 数据 , 取 xs 和 =0.05, axg 队 =0.10, 经 逐步 选择 法 对 6 个 变量 进行 筛选 , Cox 回归 分 
析 结 果 见 表 14-6。 
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表 14-4 乳腺 瘤 手术 治疗 的 预后 影响 因素 及 赋值 











因素 变量 名 赋值 说 明 
年 龄 ( 岁 ) 
病理 分 型 起 非 浸润 型 =0, 浸润 型 =1 
淋巴 结 转移 妈 否 =0, 是 =1 
肿瘤 大 小 > A <2cm=0,3~5cm=1,>5cm=2 
化 疗 下 否 =0, 是 =1 
绝经 bp a 否 =0, 是 =1 
生存 时 间 t (月 ) 
生存 结局 区 删 失 =0, 复 发 =1 





表 14-5 ”68 例 乳 腺 瘤 患者 手术 后 的 生存 时 间 ( 月 ) 及 影响 因素 











No X% Xe % xX xX Xs t Y 
1 56 1 0 2 1 1 9 0 
多 32 1 1 1 1 0 25 0 
3 81 0 0 1 0 39 0 
4 35 0 1 1 1 0 6 0 
5 41 1 1 3 0 0 13 1 
6 3 1 1 3 1 0 26 1 
49 1 0 2 1 0 86 1 
65 46 1 1 光 0 0 2 1 
66 55 1 1 3 1 1 3 0 
67 33 1 0 1 L 0 20 0 
68 64 1 0 3 1 il 28 1 





注 : 完整 数据 见 网 络 增值 服务 


表 14-6 ”68 例 乳 腺 癌 患 者 Cox 回归 分 析 结 果 








变量 有 SE( 有 ) Wald 邓 P HR 95%CI( HR) 
加 1.550 0.518 8.944 0.003 4.711 (1.706, 13.008) 
XX 0.959 0.297 10.434 0.001 2.609 (1.458, 4.668) 








分 析 结 果 显 示 , 淋巴 结 转移 和 肿瘤 大 小 的 回归 系数 均 为 正 值 , 说 明 它 们 是 影响 乳腺 癌 患 者 
术 后 复发 的 危险 因素 。 在 肿瘤 大 小 保持 不 变 的 情况 下 ,有 淋巴 结 转移 者 的 复发 风险 是 无 淋巴 结 
转移 者 的 4.711 倍 ; 同样 , 在 淋巴 结 转移 保持 不 变 的 情况 下 , 肿瘤 大 小 每 增加 一 级 , 复发 风险 增 
加 2.609 倍 。 


四 .注意 事项 

1. 在 研究 设计 时 , 应 根据 研究 目的 明确 规定 所 研究 生存 时 间 的 终点 事件 和 起 始 事件 , 由 于 
终点 事件 和 起 始 事件 是 相对 的 , 所以, 一 旦 确定 , 则 不 能 在 研究 过 程 中 随意 改变 它们 。 

2. 研究 的 样本 含量 一 般 在 40 例 以 上 ; 当 协 变量 增加 时 也 应 适当 增加 , 要 求 样本 含量 为 观 
察 协 变量 的 5~20 倍 ; 两 组 资料 比较 时 , 最 好 两 组 例 数 基本 一 致 。 在 随访 观察 时 , 要 尽量 避免 观 
察 对 象 的 失 访 , 截 尾数 据 过 多 容易 造成 研究 结果 的 偏 倚 。 

3. 进行 Cox 回归 分 析 时 , 要 求 资料 满足 比例 风险 恒定 假定 , 若 资料 不 满足 此 假设 , 说 明 某 些 
危险 因素 的 作用 强度 随时 间 而 变化 , 使 得 相对 风险 函数 也 随时 间 而 改变 。 检 验 这 一 假定 条 件 的 
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方法 可 以 根据 变量 分 组 的 Kaplan-Meier 生存 曲线 是 否 交叉 进行 判断 。 如 果 数 据 不 满足 比例 风险 
的 假定 , 则 需要 采用 时 变 (time-dependent) 协 变量 模型 或 非 比 例 风险 模型 (non-proportional hazard 
model) 进 行 分 析 , 具体 内 容 可 以 参考 有 关 书 籍 。 

4. Cox 分 析 结 果 中 的 偏 回归 系数 不 能 直接 用 于 比较 不 同 因素 的 影响 大 小 , 需 通过 标准 化 回 
归 系 数 进行 比较 , 一 般 的 统计 软件 能 够 直接 给 出 其 估计 值 。 








练习 题 
一 、 单 项 选择 题 
1. 进行 生存 分 析 时 ,不 属于 截 尾数 据 的 是 ( ) 
A. 随访 期 内 死 于 本 病 者 B. 随访 期 内 死 于 其 他 病因 者 
| C. 随访 结束 时 仍 存 活 者 D. 随访 期 内 找 不 到 者 


| E. 随访 期 内 拒绝 应 答 者 


2. 生存 分 析 中 的 生存 时 间 是 ( 。 ) 
| A. 观察 开始 至 终止 的 时 间 B. 观察 开始 至 失 访 的 时 间 
| C. 出 院 至 失 访 的 时 间 D. 观察 起 点 到 终点 事件 出 现 的 时 间 
| rt 
3， 生 存 分 析 中 ， 撕 述 生存 时 间 的 集中 趋势 宜 用 的 指标 是 (。 ) 
er B. 几何 均 效 
C， 中 位 数 D， 百 分 位 数 
E. 众 数 


4. 不 宜 作 生存 分 析 的 情况 是 ( ) 
A. 女性 乳腺 癌 总 者 手术 之 后 的 存活 时 间 B. 患者 胃 出 血 的 持续 时 间 
C. 种 者 确诊 肝炎 后 肝 功能 异常 的 持续 时 间 DD. 疯 订 起 到 终点 事件 出 现 的 时 间 
E. SR 内 保存 的 有 效 时 间 






5. 生存 曲线 下 降 的 坡度 越 陡 , 表示 的 是 ( ) 
痪 ， es B. 生存 时 间 越 长 
生存 时 间 光 每 D. 与 生存 时 间 无 关 
. 生存 率 赵 提 高 
6. Cox 回归 的 应 变量 是 (  ) 
A. 生存 时 间 B. 结局 变量 
. 生存 时 间 和 结局 变量 D. 生存 率 


E. 死亡 概 闪 
.Kaplan-Meier 法 届 于 ( ) 


-~ 


B. 非 参数 法 
D. 回归 分 析 法 


B. 非 参数 法 
D. Cox 回归 法 





EE. Breslow 检验 法 





9. 风险 比 HR 指 的 是 ( ) 
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A. 两 种 不 同 条 件 下 死亡 概率 之 比 B. 两 种 不 同 条 件 下 生存 概率 之 比 
C. 两 种 不 同 条 件 的 危险 六 函数 之 比 D. 死亡 率 与 生存 率 之 比 


E. 死亡 概 滨 与 生存 概率 之 比 
10. Cox 回归 模型 中 的 回归 系数 表示 的 意义 是 ( ) 

A. 模型 预测 能 力 大 小 B. 危险 因素 相对 作用 大 小 

C. 自 变量 能 够 解释 应 变量 的 百 分 D. 自 变量 不 同 取 值 出 现 结局 的 风险 比 

E. 一 组 自 变 量 取 值 时 出 现 6 er 
二 、 计算 与 分 析 

1. 用 某 中 药 结合 化 党 (中 西 治疗 组 ) 和 化 疗 组 (对 照 组 ) 两 种 疗法 治疗 某 种 恶性 肿瘤 
后 ,随访 记录 各 观察 对 象 的 生存 时 间 ( 月 ) 如 下 , "+" 表 示 删 失 数据 , 试用 K-M 法 估计 两 种 
疗法 的 生存 举 , 并 比较 两 组 疗法 生存 率 是 否 有 差别 ? 

中 药 组 10 2 12 13 18 6 1 26 9 8 6 4 9 4 31 24 

E34 和 和 卫生 

. 茶 研 究 者 拟 研究 影响 卵 虹 癌 患 者 术 后 生存 时 间 的 有 关 因 素 。 观 察 了 26 名 卵 昌 癌 

患 记录 的 观测 指标 及 观测 值 如 下 表 , 试 进行 Cox 回归 分 析 。 




















各 指标 数据 赋值 表 

指标 含 闫 赋值 或 单位 

Xl 年 龄 岁 

站 细胞 分 化 程度 1= 高 分 化 2= 中 分 化 3= 低 分 化 

婚 淋巴 细胞 浸润 程度 =I 级 2=I[ 级 3= 亚 级 

已 手术 病灶 残留 en 

1 生存 时 间 月 
天 生存 结局 0= 删 失 1= 死 亡 
26 名 卵巢 癌 患 者 生存 时 间 及 观察 数据 
编号 xX 2 Xs OG t YA 

1 67 pa 3 8.4 1 | 
2 50 3 3 5.5 3 1 
60 1 3 23 村 1 
4 53 p 3 SN 8 1 
5 47 2 3 13.7 10 1 
6 48 3 3 9.3 12 1 
7 56 3 3 33.3 13 1 
8 50 3 3 5.9 15 1 
9 43 3 3 4.6 15 1 
10 61 世 3 19.2 15 1 
11 46 3 3 4.1 17 1 
1 多 54 3 3 4 19 1 
13 63 3 1 3.9 24 1 
14 42 3 3 4.8 24 1 




















笔记 
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te 

编号 X 2 3 X, i v 
15 32 2 3 9.8 25 
16 61 3 2 11.6 33 1 
17 45 2 3 29.5 6 1 
18 23 2 1 9.9 36 1 
19 43 3 1 8.4 3 | 
20 44 2 3 9.2 14 | 
21 56 3 2 8.9 46 1 
22 29 多 19.8 59 1 
23 59 1 3 10.6 70 1 
24 67 1 1 14.9 83 1 
25 60 1 1 13.1 83 1 
26 57 2 1 16.3 56 0 
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医学 研究 中 ,无论 是 临床 试验 还 是 动物 实验 , 都 需要 根据 研究 目的 , 制定 研究 方案 , 进行 科 
学 合理 的 设计 。 周 密 的 研究 设计 , 既 能 够 节省 人 力 、 物 力 、 财 力 和 时 间 , 又 能 够 使 研究 因素 的 效 
应 得 以 充分 体现 , 获得 准确 、 客 观 的 结果 , 得 出 科学 的 结论 。 本 章 着 重 介 绍 实验 设计 的 三 要 素 
和 三 原则 , 同时 介绍 临床 试验 设计 及 统计 分 析 方 法 。 


第 一 节 ”实验 设计 的 三 要 素 


实验 设计 ( experimental design ) 是 指 研究 者 根据 研究 目的 和 条 件 , 结合 统计 学 要 求 , 合理 安 
排 各 种 实验 因素 , 严格 控制 实验 误差 , 最 大 限度 地 获得 丰富 而 可 靠 的 数据 。 实 验 性 研究 包括 动 
物 实验 和 临床 试验 , 通常 情况 下 , 直接 对 人 体 进行 的 研究 称 为 试验 (trial)。 实 验 研究 的 基本 要 素 
包括 研究 对 象 、 处 理 因 素 和 实验 效应 三 个 部 分 。 


-、 研 究 对 象 


研究 对 象 (study subject) 是 指 根据 研究 目的 而 确定 的 观察 总 体 , 也 称 为 受 试 对 象 或 实验 对 象 
(experimental subject )。 研究 对 象 可 以 选择 动物 或 人 ， 也 可 以 是 组 织 、 细 胞 等 , 无论 选择 什么 ,在 
实验 开始 前 必须 对 研究 对 象 的 条 件 做 出 严格 的 规定 , 以 保证 其 同 质 性 。 

1. 研究 对 象 应 具有 了 明确 的 纳入 标准 和 排除 标准 ”在 医学 研究 中 , 首先 根据 研究 目的 确定 
研究 对 象 , 并 且 对 研究 对 象 的 条 件 作 严格 的 规定 , 即 制定 严格 的 纳入 标准 和 排除 标准 , 以 保证 
其 同 质 性 。 如 动物 实验 时 ,需要 考虑 动物 的 种 属 和 品系 , 同时 还 要 注意 性 别 、 体 重 和 寞 别 等 , 使 
其 具有 可 比 性 , 因为 这 些 条 件 可 能 影响 实验 结果 。 进 行 临床 试验 时 , 应 根据 研究 目的 拟定 严格 
的 纳入 排除 标准 , 如 临床 诊断 、 病 情 、 年 龄 .是 否 有 其 他 疾病 等 , 对 受 试 对 象 进 行 筛选 , 确保 研究 
顺利 进行 。 

2. 选择 对 处 理 因素 敏感 性 强 的 研究 对 象 ” 如 研究 致 畸 作 用 常 选择 大 鼠 。 临 床 试验 中 ,如 
研究 某 新 药 对 冠 心病 患者 心律 失常 的 疗效 , 应 选择 心律 失常 经 常 发 作 的 冠 心病 患者 作为 研究 
对 象 , 而 排除 偶然 发 作 的 短暂 心律 失常 的 患者 , 因为 他 们 在 观察 期 内 对 该 药 的 治疗 很 可 能 没有 
反应 。 

3. 选择 依从 性 好 的 患者 作为 研究 对 象 ”临床 试验 要 选择 那些 能 够 服从 试验 安排 并 坚持 合 
作 的 患者 ; 否则 , 若 不 依从 的 数量 较 大 , 就 会 影响 研究 结果 的 准确 性 , 导致 研究 结果 出 现 偏 倚 。 

4. 注意 医学 伦理 学 问题 ”研究 者 应 以 患者 的 利益 为 最 高 准则 , 由 受 试 者 或 其 法 定 代理 人 
在 知情 同意 书 上 签字 并 注 明日 期 , 执行 知情 同意 过 程 的 研究 者 或 其 代表 也 需 在 知情 同意 书 上 签 
名 并 注 明 日 期 。 在 执行 过 程 中 , 当 科 研 与 治疗 发 生 冲突 时 , 要 服从 医疗 上 的 需要 , 这 样 做 才 符 
合 医学 伦理 学 要 求 。 在 动物 实验 中 , 也 要 注意 善待 动物 。 











.处 理 因 素 


处 理 因 素 (treatment) 又 称 研究 因素 (study factor), 是 指 根据 研究 目的 而 施加 于 研究 对 象 的 干 
预 措施 , 如 研究 某 降 压 药 的 效果 , 降 压 药 是 处 理 因 素 , 高 血压 患者 为 研究 对 象 。 处 理 因素 在 实验 
中 所 处 的 状态 称 为 因素 的 水 平 (level), 亦 称 处 理 水 平 。 如 比较 某 降 脂 药 三 组 不 同 剂 量 及 安慰 剂 
对 照 的 降 脂 效果 , 该 研究 只 有 一 个 处 理 因素 ,共有 4 个 不 同 水 平 ,包括 3 个 剂量 和 1 个 安慰 剂 。 
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在 实验 过 程 中 , 除 处 理 因素 外 也 能 使 受 试 对 象 产生 效应 的 因素 属于 “ 非 处 理 因素 ”, 每 一 项 
医学 实验 研究 都 可 能 受到 非 处 理 因素 的 影响 。 由 于 它 可 能 干扰 处 理 因 素 与 效应 间 的 关系 , 成 为 
“混杂 因素 ”, 在 进行 实验 之 前 , 研究 者 有 必要 经 过 周密 的 思考 , 做 出 合理 的 实验 设计 来 控制 这 


| 些 非 处 理 因素 , 以 排除 非 处 理 因素 对 处 理 因素 的 干扰 。 有 时, 即使 设计 时 能 够 考虑 到 这 些 非 处 
， 理 因素 , 但 实践 中 对 这 些 非 处 理 因素 很 难 加 以 严格 控制 , 其 实验 结果 仍 不 免 会 受到 影响 ,对 此 


可 以 用 统计 学 方法 加 以 分 析 和 校正 ,分离 出 非 处 理 因素 对 实验 结果 的 作用 , 发 现 真正 的 实验 效 
应 , 做 出 客观 的 结论 , 但 统计 学 方法 对 非 处 理 因素 的 校正 作用 是 有 限 的 , 不 能 忽视 严格 的 实验 
设计 。 

在 确定 处 理 因 素 时 , 需 注 意 以 下 两 点 : 

1. 处 理 因素 要 标准 化 ”处 理 因素 在 整个 实验 过 程 中 应 始终 保持 不 变 。 在 设计 中 应 将 处 理 
因素 的 实施 方法 规定 得 具体 、 细致。 其 目的 是 使 处 理 因素 在 实验 过 程 中 保持 稳定 , 有 利于 分 析 
处 理 因素 与 实验 结果 之 间 的 关系 。 例 如 , 应 明确 给 出 受 试 对 象 的 处 理 次 数 、 每 次 的 剂量 , 对 化 


学 试剂 应 规定 试剂 的 生产 单位 、 批 号、 纯度 和 配制 规范 ; 观察 药物 疗效 应 具体 规定 采集 病人 尿 、 
| 血样 本 的 时 间 及 间隔 等 。 在 新 药 临床 试验 中 , 药物 要 固定 生产 厂家, 药物 成 分 性质 、 批 号 、 剂 


量 应 一 致 ,保存 方法 应 相同 ; 在 评价 手术 疗效 时 , 要求 手术 操作 者 的 熟练 程度 自始至终 保持 恒 
定 , 否则 将 会 对 实验 结果 产生 影响 。 
2. 明确 处 理 因素 和 非 处 理 因素 ”处理 因素 是 根据 研究 目的 而 确定 的 。 实 验 中 的 处 理 因素 





| 不 宜 过 多 , 非 处 理 因素 在 对 比 组 中 要 保持 均衡 , 找 出 重要 的 非 处 理 因素 , 加 以 控制 , 这 样 才能 排 


除非 处 理 因素 的 可 能 混杂 与 干扰 作用 , 突出 处 理 因 素 的 主要 作用 , 使 处 理 因素 的 效应 得 以 分 离 ， 





”保证 医学 实验 研究 的 成 功 。 


三 .实验 效应 


实验 效应 (experimental effect) 是 处 理 因素 作 用 于 受 试 对 象 产生 的 反应 和 结果 , 通过 具体 的 
观察 指标 来 表达 。 如 果 指 标 选 择 不 当 , 未 能 准确 地 反映 处 理 因 素 的 作用 , 所 获得 的 研究 结果 就 
缺乏 科学 性 , 因此 选择 恰当 的 观察 指标 是 关系 研究 成 败 的 重要 环节 。 

1. 主观 指标 和 客观 指标 ”选用 的 指标 要 尽量 客观 , 客观 指标 不 易 受 主观 因素 影响 。 如 电 
生理 以 及 大 多 数 临床 化 验 数据 (如 血糖 .甘油 三 酯 .胆固醇 等 ) 都 是 客观 指标 , 如 果 研 究 的 指标 
是 通过 研究 对 象 回答 或 描述 症状 得 到 , 以 及 研究 人 员 自 行 判 断 或 医生 通过 体征 检查 的 项 目 , 一 
般 都 属于 主观 指标 。 主 观 指标 易 受 研究 对 象 和 研究 人 员 的 心理 状态 .启发 暗示 和 感官 差异 的 影 
响 , 在 实验 设计 中 应 尽量 不 作为 主要 指标 。 在 实验 设计 中 , 若 一 定 要 采用 主观 指标 , 就 必须 采 
取 措 施 以 减少 或 消除 主观 因素 的 影响 。 如 评价 镇 痛 药 物 的 效果 , 需要 借助 病人 疼痛 程度 的 主观 
描述 加 以 反映 , 可 以 采用 一 定 的 措施 来 量化 主观 指标 , 如 借助 疼痛 测量 尺 , 尺 的 正面 为 微笑 符 
号 (不 痛 ) 到 悲伤 符号 (非常 痛 ), 在 两 者 之 间 设 置 游标 , 面向 受 试 对 象 , 让 其 根据 疼痛 感觉 划 动 
游标 , 选择 两 个 等 级 之 间 的 某 个 位 置 ; 而 尺 的 背面 为 0~10 的 评分 ,反映 疼痛 由 轻 到 重 的 等 级 ， 
面向 测试 者 , 根据 病人 所 划 动 的 游标 位 置 进行 记录 , 由 此 采用 统一 的 标准 ,将 病人 的 主观 疼痛 
感觉 量化 ,减少 病人 的 主观 影响 。 

2. 选择 灵敏 度 和 特异 度 高 的 指标 “灵敏 度 是 指 某 处 理 因素 存在 时 , 所 选 指标 能 够 反映 处 
理 因素 的 效应 程度 , 即 反映 指标 检 出 真 阳性 的 能 力 。 有 灵敏度 高 的 指标 可 以 减少 假 阴 性 率 , 而 灵 
敏 度 低 的 指标 不 能 充分 地 反映 处 理 因素 的 作用 , 如 治疗 慢性 脂肪 肝 选 用 和 谷 两 转氨酶 、 谷 草 转 氨 
酶 作为 疗效 指标 就 不 敏感 , 因为 这 些 指标 都 是 急性 指标 , 并 不 是 所 有 慢性 脂肪 肝 患 者 这 些 指标 
都 表现 为 异常 ,而 B 超 或 CT 影像 则 随 病 情 的 变化 而 变化 , 可 以 较 敏锐 地 反映 出 治疗 的 作用 。 特 
异 度 是 指 某 处 理 因素 不 存在 时 所 选 指标 不 显示 处 理 效应 的 程度 , 即 反 喘 指标 鉴别 真 阴性 的 能 
力 。 特 异性 高 的 指标 能 较 好 地 揭示 处 理 因素 的 作用 , 不易 受 混杂 因素 的 十 扰 , 可 减少 实验 结果 
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的 假 阳 性 率 , 如 乙 型 肝炎 抗 病毒 治疗 中 , 研究 的 主要 指标 为 HBV-DNA, 其 值 小 于 10*(IU/ml) 即 
为 阴性 , 表明 乙肝 病毒 处 于 低 复制 状态 。 因 此 , 所 选 指标 最 好 同时 具有 较 高 的 灵敏 度 与 特异 度 。 

3. 观察 指标 的 准确 度 和 精密 度 ”准确 度 (accuracy ) 是 指 研究 结果 与 相应 测定 事物 真实 情况 
符合 或 接近 的 程度 , 主要 受 系统 误差 的 影响 。 精 密度 (precision ) 是 指 相同 条 件 下 对 同一 对 象 的 
某 项 指标 进行 重复 测量 时 , 观测 值 与 其 均值 的 接近 程度 , 主要 受 随机 因素 的 影响 。 精 密度 有 两 
重 含义 : 一 是 仪器 设备 本 身 具 有 的 精度 , 另 一 种 是 指 在 反复 测试 过 程 中 应 控制 的 精度 , 它 可 以 
通过 制定 操作 规范 和 技术 培训 进行 控制 。 无 论 是 准确 度 还 是 精密 度 , 其 水 平 高 低 都 显示 了 研究 
工作 质量 的 好 坏 , 一 般 要 将 其 控制 在 专业 规定 的 容许 范围 内 。 





二 节 ”实验 设计 的 三 原则 


在 医学 实验 研究 中 , 由 于 存在 各 种 非 处 理 因素 的 干扰 , 可 能 使 实验 结果 产生 偏 倚 。 为 了 减 
少 偏 倚 , 人 研究 设计 时 , 必须 遵循 实验 设计 的 基本 统计 原则 , 即 对 照 原则 、 随 机 化 原则 和 重复 原则 。 


一 .对照 原 则 


对 照 (control) 是 指 在 实验 中 应 设立 对 照 组 , 其 目的 是 通过 与 对 照 组 效应 对 比 鉴别 出 实验 组 
的 效应 大 小 。 只 有 设立 了 对 照 组 , 才能 消除 非 处 理 因素 对 实验 结果 的 影响 , 从 而 使 处 理 因素 的 
效应 得 以 体现 。 处 理 因素 的 效应 大 小 , 是 通过 与 对 照 组 对 比 所 得 到 的 差别 显现 。 临 床 有 很 多 疾 
病 , 如 感冒 、 慢 性 气管 炎 、 关 节 酸 痛 和 早期 高 血压 等 疾病 不 经 药物 治疗 , 也 会 自 愈 或 随 着 季节 变 
化 而 缓解 , 因此 必须 设立 对 照 组 。 医 学 研究 中 常用 的 对 照 组 形式 主要 有 以 下 几 种 , 应 该 根据 研 
究 目的 和 研究 条 件 等 因素 的 不 同 , 选择 适当 的 对 照 形式 。 

1. 空白 对 照 ” 空 白 对 照 (blank control) 指 对 照 组 不 给 予 任何 处 理 。 该 对 照 形式 反映 了 研究 
对 象 在 实验 过 程 中 的 自然 变化 。 如 研究 某 药 物 的 抑 瘤 效果 ,将 大 白鼠 染 冶 后 , 实验 组 大 白鼠 的 
饲料 中 投放 该 药物 ,对 照 组 大 白鼠 的 饲料 中 不 投放 。 由 于 空白 对 照 容易 引起 实验 组 和 对 照 组 受 
试 对 象 的 心理 差异 , 从 而 影响 实验 效果 的 测定 , 因此 , 临床 试验 一 般 不 宜 使 用 空白 对 照 。 

2. 安慰 剂 对 照 ”安奈 剂 对 照 ( placebo control ) 指 对 照 组 使 用 一 种 不 含 药物 有 效 成 分 的 “ 擅 
药物 ”, 即 安慰 剂 (placebo), 其 外 观 、 气 味 、 剂 型 和 处 置 上 均 与 实验 药物 相同 , 不 能 为 受 试 对 象 所 
惧 别 , 常用 于 临床 试验 。 使 用 安慰 剂 的 目的 在 于 克服 研究 者 、 受 试 者 、 参 与 疗效 和 安全 性 评价 
的 工作 人 员 由 于 心理 因素 所 造成 的 偏 倚 , 有 助 于 防止 对 照 组 的 病人 产生 与 试验 组 的 病人 不 同 的 
心理 ,使 用 时 要 注意 保密 。 设 置 安慰 剂 对 照 可 以 消除 疾病 自然 进展 的 影响 , 并 分 离 出 由 于 试验 
药物 所 引起 的 不 良 反 应 , 是 金 标准 的 对 照 形式 。 需 要 注意 的 是 , 安慰 剂 中 不 含 药物 的 有 效 成 分 ， 
相当 于 未 对 患者 采取 有 效 的 治疗 , 可 能 存在 医学 伦理 学 问题 , 需 持 慎重 态度 。 

3. 标准 对 照 ”对 照 组 采用 现 有 标准 方法 或 常规 方法 , 或 不 专门 设立 对 照 组 , 而 以 标准 值 或 
正常 值 作为 对 照 , 对 此 称 为 标准 对 照 (standard control)。 例 如 ， 在 新 药 临床 试验 中 , 对 照 组 采用 
目前 疗效 明确 的 某 种 药物 (代表 当时 疗法 的 水 平 ), 试验 组 患者 采用 某 种 新 药 , 目前 疗效 明确 的 
药物 组 就 是 标准 对 照 组 。 

4. 实验 对 照 ”对照 组 不 施加 感 兴趣 的 处 理 , 但 施加 某 些 有 关 的 实验 因素 。 实 验 对 照 (expe- 
rimental control ) 常 用 于 有 刺激 、 有 损伤 的 动物 实验 , 如 假 注射 、 假 手术 等 , 其 目的 是 使 两 组 动物 
所 受到 的 刺激 、 损 伤 相同 , 以 避免 施加 处 理 的 方式 可 能 对 动物 产生 的 影响 。 如 研究 某 种 注射 剂 
的 效果 , 实验 组 动物 注射 该 制剂 , 而 对 照 组 动物 注射 无 药理 作用 的 生理 盐水 , 使 两 组 动物 均 接 
受 注 射 , 接受 的 刺激 与 损伤 保持 一 致 。 

5. 自身 对 照 ” 自 身 对 照 (self-control ) 是 指 对 照 与 实验 在 同一 受 试 者 身上 进行 , 可 以 是 同一 
受 试 者 不 同 处 理 前 后 , 也 可 以 是 不 同 身体 位 置 。 如 选用 双 下 肢 烧 伤 程度 相同 的 病人 , 一 侧 采 用 
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阳性 药物 , 另 一 侧 采 用 试验 药物 , 从 而 避免 个 体 差异 引起 的 误差 。 

6. 相互 对 照 。 相 互 对 照 (mutual control ) 指 各 实验 组 之 间 互 为 对 照 。 例 如 , 比较 几 种 不 同 药 
物 或 同一 种 药物 不 同 剂量 对 某 种 疾病 的 疗效 , 目的 是 比较 其 疗效 差别 时 , 可 以 使 用 相互 对 照 。 

7. 历史 对 照 ”历史 对 照 (historical control ) 不 专门 设立 对 照 组 , 而 是 以 过 去 的 研究 结果 作为 
对 照 , 如 晚期 肝癌 以 往 的 治愈 率 接近 为 0, 若 研发 的 某 种 新 药 , 临床 医生 用 该 药 治愈 了 几 例 该 癌 
症 患 者 , 在 此 药物 试验 中 , 尽管 未 专门 设立 对 照 组 , 而 潜在 的 无 治愈 的 病例 作为 对 照 。 一 般 情 
况 除了 难以 治疗 的 疾病 外 , 一 般 不 宜 提 倡 该 对 照 。 因 为 历史 资料 与 现存 数据 可 能 存在 不 可 比 的 
问题 。 

需要 注意 的 是 , 通常 不 宜 仅 设立 一 个 处 理 组 , 并 对 该 组 受 试 对 象 用 药 前 后 的 情况 进行 对 比 ， 
即 自身 前 后 对 照 设 计 。 特 别 是 对 有 短期 自 愈 倾 向 或 周期 性 发 作 倾向 的 疾病 , 实验 前 后 的 某 些 因 
素 可 能 发 生变 化 , 时 间 、 环 境 等 均 可 能 很 大 程度 上 影响 到 实验 结果 , 难以 反映 药物 的 真实 效应 。 
如 果 需 要 考察 服药 前 后 的 变化 , 通常 要 同时 设立 一 个 平行 对 照 组 , 观察 其 处 理 前 后 的 变化 情况 ， 
将 两 组 接受 干预 前 后 变化 的 差 值 进行 比较 , 以 控制 非 处 理 因素 的 影响 。 


二 、 随 机 化 原则 


随机 化 (randomization ) 是 指 每 个 受 试 对 象 有 相同 的 概率 或 机 会 被 分 配 到 不 同 的 处 理 组 。 随 
机 不 等 于 随意 , 如 评价 A、B 两 种 药物 的 疗效 , 设置 两 个 诊室 , 让 病人 随意 选择 诊室 , 进入 1 号 诊 
室 的 服用 A 药 , 进入 2 号 诊室 的 服用 B 药 , 表面 上 好 像 病人 进入 哪个 诊室 是 随机 的 ,但 是 ,在 病 
人 选择 诊室 的 过 程 中 已 经 掺 杂 了 主观 性 , 如 从 众 心理 , 可 能 大 家 都 会 倾向 于 选择 就 讼 人 数 多 的 
诊室 。 因 此 , 这 样 的 分 组 不 仅 违背 了 随机 化 的 原则 , 还 可 能 导致 两 个 组 别 之 间 病 人 在 年 龄 .性 
别 、 病 情 等 方面 不 具有 可 比 性 , 导致 试验 结果 出 现 偏 倚 。 

随机 化 分 组 可 以 使 各 处 理 组 的 受 试 对 象 具有 相近 的 特征 , 可 比 性 好 ; 避免 研究 者 的 主观 因 
素 对 分 组 结果 的 影响 ; 另外 , 随机 化 是 所 有 统计 方法 的 理论 基础 , 非 随 机 样本 进行 比较 时 得 到 
的 推断 结果 其 可 信 度 往往 值得 怀疑 。 

随机 化 分 组 主要 通过 随机 数 (random number) 来 实现 。 常 用 方法 有 两 种 , 即 由 随机 数字 表 
(table of random number) 和 由 计算 机 程序 产生 随机 数 。 各 种 统计 软件 如 SAS、SPSS 等 , 以 及 常用 
的 办 公 软 件 如 Excel, 均 可 以 产生 随机 数 。 当 采用 统计 软件 生成 随机 数 时 , 可 设置 种 子 数 使 得 所 
产生 的 随机 数 能 够 再 次 生成 , 即 具 有 重 现 性 , 这 是 目前 使 用 较 多 的 产生 随机 数 的 方法 。 

举例 , 见 表 15-1, 将 20 位 受 试 者 随机 分 配 到 两 组 中 。 左 起 第 二 列 为 随机 数 , 由 SPSS 产生 
( 取 均 匀 分 布 的 随机 数 , 种 子 数 为 2013, 可 重 现 ); 第 三 列 为 对 第 二 列 随 机 数 编 秩 , 遇 相 同 数 可 以 

















表 15-1 随机 分 配 20 位 受 试 者 
_ 十 序号 。 随机 数 对 随机 数 纺 秩 号。 组 别 | 顺序 号 。 随机 数 。 对 随机 数 编 秩 号 组 别 








1 yd 11 2 11 6 9 1 
时 16 15 4 12 11 13 2 
3 17 17 2 13 18 18 2 
4 4 3 1 14 6 2 1 
5 5 4 1 15 10 12 2 
6 4 多 1 16 6 8 1 
示 1 1 1 1 16 14 2 
8 汪 10 1 18 地 16 2 
9 5 6 1 19 3 3 1 
10 20 20 2 20 19 19 六 
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顺序 编 ; 第 四 列 为 根据 第 三 列 的 秩 号 分 组 , 秩 号 1~10 为 第 一 组 , 秩 号 11~20 为 第 二 组 。 受 试 者 
可 以 根据 入 组 顺序 ,依次 进入 对 应 的 组 别 。 如 前 三 位 受 试 者 进入 第 二 组 ,第 四 位 至 九 位 受 试 者 
进入 第 一 组 , 第 十 位 受 试 者 进入 第 二 组 , 依次 类 推 , 20 位 受 试 者 随机 化 人 组 完毕 。 

目前 采用 的 随机 化 方法 包括 简单 随机 化 、 区 组 随机 化 、 分 层 随机 化 、 分 层 区 组 随机 化 和 动 
态 随 机 化 等 , 近年 来 还 出 现 了 中 央 随 机 化 的 新 方式 , 这 些 方 法 可 以 在 简单 随机 化 基础 上 进行 ， 
此 外 不 再 效 述 。 


:重复 原则 


重复 (replication ) 是 指 在 相同 实验 条 件 下 重复 进行 多 次 观察 。 重 复 是 消除 非 处 理 因素 影响 
的 又 一 重要 方法 , 表现 为 样本 量 的 大 小 和 重复 次 数 的 多 少 。 由 于 各 种 影响 因素 的 存在 , 不 同 研 
究 对 象 对 同一 处 理 因素 的 反应 不 同 , 表现 为 其 效应 指标 的 数值 不 同 , 只 有 在 大 量 重复 实验 的 条 
件 下 , 实验 的 效应 才能 反映 其 真正 的 客观 规律 性 ; 反之 , 如 果 样 本 量 不 够 , 结果 就 不 够 稳定 , 得 
不 到 应 有 的 结论 。 从 统计 学 的 角度 讲 , 观察 例 数 越 多 , 根据 样本 计算 的 频率 或 平均 数 等 统计 量 
越 接近 总 体 参数 。 重 复原 则 并 非 要求 无 限 大 的 样本 , 样本 量 太 大 , 工作 量 也 大 , 增 大 人 力 物 力 
的 消耗 ,难于 控制 实验 条 件 , 影响 研究 的 质量 。 样 本 量 究竟 需要 多 大 , 可 以 采用 统计 学 方法 进 
行 计算 , 详 见 本 章 第 四 节 。 


第 三 节 ”临床 试验 设计 及 统计 分 析 问 题 


临床 试验 (clinical trial ) 从 研究 的 性 质 划分 , 属于 实验 性 研究 的 范畴 。 临 床 试验 设计 也 必须 
遵循 实验 设计 的 基本 原理 , 其 设计 的 基本 要 素 也 包括 研究 对 象 、 处 理 因 素 和 实验 效应 , 同时 必 
须 遵循 对 照 、 随 机 化 和 重复 的 基本 原则 。 但 由 于 其 研究 对 象 为 人 , 还 应 该 考虑 受 试 者 的 知情 同 
意 、 心 理 因素 、 伦 理 道德 等 问题 , 因此 临床 试验 的 设计 与 分 析 具 有 特殊 性 , 目前 国际 上 对 撰写 临 
床 随机 对 照 试 验 (randomized controlled trial, RCT) 报 告 提供 了 参考 标准 (附录 1)。 本 节 以 新 药 临 
床 试验 为 例 , 针对 其 特殊 性 , 简要 介绍 临床 试验 的 设计 及 统计 分 析 方 法 , 其 他 临床 研究 亦 可 参 
照 进 行 。 

、 临 床 试 验 的 特点 及 注意 事项 

1. 临床 试验 的 分 期 “临床 试验 分 1~ 人 期, [期 试验 对 象 为 少量 志愿 者 , 主要 为 耐 受 性 试验 
和 药 代 动力 学 试验 。 耐 受 性 主要 观察 单 次 或 多 次 给 药 的 生命 体征 、 实 验 室 指标 的 异常 变化 和 不 
良 反应 的 发 生 情况 , 确定 临床 给 药 的 安全 范围 ; 药 代 动力 学 主要 观察 药物 在 体内 的 分 布 、 吸 收 
与 代谢 的 情况 。 期 试验 主要 是 探索 适应 症 的 类 型 、 最 适 剂 量 以 及 研究 价值 。 夺 期 试验 是 确证 
性 研究 , 证 实 试验 药物 的 疗效 和 安全 性 。 信 期 试验 则 是 上 市 后 进行 的 试验 。 不 同期 别 的 临床 试 
验 所 要 求 的 样本 含量 和 使 用 的 统计 学 方法 都 有 所 不 同 。 

2. 主要 指标 的 确定 ”由 于 一 个 临床 试验 通常 只 有 一 个 研究 目的 , 因此 , 必须 明确 定义 能 够 
反映 处 理 因素 效应 的 主要 观察 指标 , 安全 性 也 可 以 是 主要 指标 。 主 要 指标 的 选择 应 考虑 相关 领 
域 已 有 的 公认 准则 和 标准 , 通常 情况 只 选 1~2 个 主要 指标 。 主 要 指标 是 临床 试验 评价 和 样本 含 
量 估计 的 主要 依据 。 

3. 设立 合理 的 对 照 ” 因 为 研究 对 象 是 人 , 如 何 设立 对 照 组 必须 慎重 考虑 , 决 不 允许 研究 工 
作 所 设立 的 对 照 组 对 受 试 者 的 健康 有 所 危害 。 在 临床 疗效 的 研究 中 , 可 以 使 用 安慰 剂 对 照 , 但 
要 以 保护 受 试 者 的 根本 利益 为 原则 , 有 其 严格 的 适用 范围 。 如 要 评价 一 种 新 药 对 某 型 菌 痢 疗效 
如 何 , 就 不 宜 设立 安慰 剂 对 照 。 标 准 对 照 是 临床 试验 通常 采用 的 对 照 形式 , 即 采 用 目前 通用 的 
治疗 方法 或 疗效 较 好 的 常规 阳性 药物 作为 对 照 。 


如 
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4. 对 照 的 实施 ”为 了 避免 研究 者 及 受 试 者 对 不 同 组 别 产生 的 不 同心 理 反 应 , 通常 需 采 用 
“ 盲 法 (blind method 六 进行 试验 。 盲 法 分 双 盲 (double blind ) 和 单 盲 (single blind ) 两 种 。 所 谓 双 
盲 是 指 研究 者 和 受 试 者 在 整个 试验 过 程 中 都 不 知道 受 试 者 所 接受 的 是 何 种 处 理 (试验 药 或 对 照 
药 ); 单 盲 是 指 仅 受 试 者 处 于 盲 态 。 盲 法 可 以 避免 研究 者 和 受 试 者 对 试验 结果 的 人 为 干扰 ,是 控 
制 临 床 试验 结果 出 现 偏 倚 的 重要 措施 。 

5. 意向 性 分 析 的 原则 ”意向 性 分 析 的 原则 (intention to treat principle, ITT ) 是 指 主要 分 析 
应 包括 所 有 随机 化 的 受 试 者 。ITT 原则 不 管 受 试 者 随机 化 后 是 否 违背 方案 、 是 否 接 受 处 理 、 是 
否 有 随机 化 后 的 观察 结果 、 依 从 性 好 坏 、 是 否 完成 治疗 等 , 均 纳入 分 析 。 根 据 意向 性 分 析 原 则 
确定 的 数据 集 称 为 全 分 析 集 (full analysis set, FAS)， 基于 全 分 析 集 的 分 析 结 果 为 主要 分 析 结 果 。 
此 外 , 还 需 确 定 符合 方案 集 (per protocol set, 简称 PPS), 即 符合 试验 方案 , 依从 性 好 且 完 成 试验 
过 程 的 受 试 者 集合 。 实 际 中 需 同 时 对 FAS 和 PPS 进行 分 析 , 如 果 两 个 结果 不 一 致 , 下 结论 时 需 
作出 解释 。 


二 、 临 床 试验 的 设计 类 型 
常用 的 临床 试验 设计 类 型 有 平行 组 设计 、 交 叉 设计 、 析 因 设计 等 。 
(一 ) 平行 组 设计 
平行 组 设计 (parallel groups design ) 是 最 常用 的 临床 试验 设计 类 型 ,是 指 将 受 试 者 随机 地 分 
配 到 试验 的 各 组 , 各 组 同时 进行 试验 。 平 行 组 设计 可 设置 一 个 或 多 个 对 照 组 , 试验 药 也 可 设置 





的 有 效 治疗 药物 , 安慰 剂 的 使 用 则 必须 符合 医学 伦理 学 要 求 。 最 简单 的 临床 试验 设计 方法 是 设 
置 一 个 试验 组 和 一 个 对 照 组 , 称 为 双 辟 试验 (two-arm trial )。 有 时 设 多 个 对 照 组 , 如 设置 一 个 安 
奈 剂 组 和 一 个 阳性 对 照 组 , 称 为 三 臂 试验 (three-arm trial)。 设 置 多 个 试验 组 则 常用 来 探索 试验 
药物 不 同 剂量 的 作用 。 

例 15-1 ”为 评价 吡 格 列 酮 治疗 2 型 糖尿 病 的 疗效 和 安全 性 , 以 磺 酰 脲 类 降 糖 药 为 阳性 对 
照 , 进行 多 中 心 、 随机、 平行 组 设计 临床 试验 , 其 设计 格式 如 图 15-1 所 示 。 








试验 组 : 吡 格 列 酮 
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对 照 组 : 磺 酰 腺 类 如 





图 15-1 平行 组 设计 示意 图 


平行 组 设计 的 主要 特点 : 实施 起 来 较为 简单 ,可 以 将 受 试 者 不 等 比例 地 分 配 到 各 治疗 组 ， 
但 与 其 他 设计 类 型 相 比 , 该 设计 通常 需要 更 多 的 受 试 者 。 

(二 ) 交叉 设计 

交叉 设计 (cross-over design ) 是 一 种 特殊 的 自身 对 照 设计 , 是 将 自身 比较 和 组 间 比 较 综 合 应 
用 的 一 种 设计 方法 , 即 每 个 受 试 者 随机 地 在 两 个 或 多 个 不 同 试验 阶段 分 别 接受 指定 的 处 理 ( 试 


| 验 药 或 对 照 药 )。 例 如 , 在 一 项 用 于 治疗 偏 头 痛 的 新 药 临床 试验 中 , 将 每 个 受 试 者 随机 分 配 到 


AB 或 BA 两 个 不 同 的 试验 顺序 组 中 ; AB 顺序 组 的 患者 在 第 一 阶段 服用 新 药 , 在 第 二 阶段 服用 
安慰 剂 ; 而 BA 顺序 组 则 相反 , 患者 在 第 一 阶段 服用 安慰 剂 , 在 第 二 阶段 服用 新 药 。 

例 15-2 为 评价 两 种 降 压 药物 A、B 的 作用 , 进行 随机 双 盲 交叉 设计 临床 试验 , 其 设计 格式 
如 图 15-2 所 示 。 

交叉 设计 的 主要 优点 : 由 于 同一 受 试 者 接受 多 种 处 理 , 可 以 明显 节省 样本 量 ; 另外 ,该 方法 
能 够 很 好 地 控制 个 体 间 的 差异 和 时 间 对 处 理 因 素 的 影响 , 试验 效率 比较 高 。 主 要 缺点 : 同一 个 
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图 15-2 交叉 设计 示意 图 


受 试 者 可 能 需要 接受 多 种 处 理 和 经 历 多 个 洗 脱 期 , 从 而 使 研究 周期 过 长 , 如 果 受 试 者 无 法 坚持 
到 最 后 而 退出 试验 , 则 造成 数据 缺失 ; 另外 , 必须 安排 洗 脱 阶段 , 否则 会 直接 影响 对 处 理 因 素 作 


用 的 正确 评估 。 在 临床 上 交叉 设计 多 用 于 生物 等 效 性 研究 、 或 者 评价 可 以 缓解 症状 但 无 根治 作 | 


用 药物 的 疗效 , 如 治疗 肿瘤 化 疗 引 起 的 呕吐 、 降 血压 等 药物 的 疗效 比较 。 
(三 ) 析 因 设计 
析 因 设计 (factorial design ) 是 一 种 多 因素 的 不 同 水 平 进行 的 交叉 分 组 试验 设计 ， 通过 不 同 因 


素 不 同 水 平 的 组 合 , 对 两 个 或 多 个 处 理 及 其 交互 作用 同时 进行 评价 。 例 如 , 欲 研究 某 中 药 复方 | 
治疗 高 胆固醇 血 症 的 效果 , 包括 该 中 药 复方 中 甲 药 和 乙 药 对 降低 胆固醇 的 作用 , 以 及 甲 药 和 乙 | 
药 是 否 有 交互 作用 。 将 高 胆固醇 患者 完全 随机 地 分 配 到 四 个 处 理 组 , 用 不 同方 法 治疗 :第 一 组 | 
用 基础 治疗 ( 既 不 用 甲 药 , 也 不 用 乙 药 ), 第 二 组 在 基础 疗法 的 基础 上 加 用 甲 药 , 第 三 组 在 基础 | 





疗法 的 基础 上 加 用 乙 药 , 第 四 组 在 基础 疗法 的 基础 上 加 用 甲 药 和 乙 药 , 比较 不 同 组 别 胆固醇 降 
低 量 。 这 样 不 仅 可 推断 处 理 因素 ( 甲 药 ` 乙 药 ) 是 否 影响 试验 结果 (胆固醇 的 降低 量 ), 还 可 检验 
处 理 因素 之 间 是 否 有 交互 作用 。 

在 析 因 设计 中 , 通常 用 数字 表达 式 表 示 不 同 因素 和 水 平 数 的 设计 ,如 2x3x2 析 因 设计 表 
示 有 3 个 因素 , 第 一 个 因素 有 2 个 水 平 , 第 二 个 因素 有 3 个 水 平 ,第 三 个 因素 有 2 个 水 平 。 最 简 
单 的 是 2x2 析 因 设计 , 即 两 因素 两 水 平 的 析 因 设计 。 

析 因 设计 是 多 因素 的 交叉 分 组 试验 设计 , 其 主要 特点 是 可 以 在 一 个 试验 中 安排 多 个 处 理 因 
素 , 同时 分 析 多 个 因素 的 主 效应 和 交互 作用 , 并 能 够 通过 比较 寻求 不 同 因素 和 水 平 的 最 佳 组 合 。 























其 缺点 是 在 因素 或 水 平 数 较 多 的 情况 下 ,需要 的 试验 组 数 和 样本 含量 都 比较 大 , 临床 上 不 容易 | 


实现 。 
三 、 临 床 试验 的 比较 类 型 

一 般 统计 检验 的 原 假设 是 两 组 (或 多 组 ) 总 体 参数 相同 , 而 备 择 假设 为 两 组 (或 多 组 ) 总 体 参 
数 间 不 同 。 在 本 书 前 面 介绍 的 大 部 分 内 容 都 是 这 种 检验 , 称 为 差异 性 检验 。 但 临床 试验 中 根据 
比较 的 目的 不 同 、 对 照 组 的 设置 不 同 , 比较 的 类 型 也 有 所 不 同 ,分 为 优 效 性 (superiority ) 试 验 、 等 
效 性 (equivalence ) 试 验 和 非 劣 效 性 (non-inferiority ) 试 验 三 种 。 

(一 ) 优 效 性 试验 

检验 一 种 药物 是 否 优 于 安慰 剂 或 男 一 种 药物 的 试验 , 称 为 优 效 性 试验 。 优 效 性 试验 的 原 
假设 为 试验 药 总 体 疗效 小 于 或 等 于 对 照 药 的 总 体 疗效 , 而 备 择 假设 为 试验 药 总 体 疗效 比 对 照 





药 好 。 拒 绝 了 原 假 设 即 可 得 出 试验 药 比 对 照 药 优 效 的 结论 。 有 时 , 试验 药 比 对 照 药 优 于 某 一 | 
具有 临床 意义 的 数值 时 才 是 优 效 , 这 时 优 效 性 试验 称 为 临床 优 效 性 试验 , 需要 制定 一 个 相应 | 


的 界 值 , 即 试验 药 与 对 照 药 之 间 相 差 的 临床 上 认可 的 最 小 值 A( 高 优 指标 ), 对 此 只 需要 计算 
两 组 差 值 的 置信 区 间 , 如 果 置 信 区 间 的 下 限 C.>A, 则 可 以 认为 试验 药物 有 效 , 如 规定 降 压 药 
物 舒张 压 下 降 的 A= 10mmHg, 则 两 组 差 值 的 下 限 必须 大 于 或 等 于 10mmHg, 才能 够 判定 该 药 
物 有 效 。 

(二 ) 非 劣 效 性 试验 

检验 一 种 药物 是 否 不 劣 于 另 一 种 药物 的 试验 , 称 为 非 劣 效 性 (non-inferiority ) 试 验 。 其 原 








笔记 
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假设 为 试验 药 总 体 疗效 比 对 照 药 的 总 体 疗效 要 差 , 且 两 药 总 体 疗效 之 差 大 于 或 等 于 非 劣 效 
界 值 A; 而 备 择 假设 为 试验 药 总 体 疗 效 比 对 照 药 的 总 体 疗效 要 好 , 或 者 试验 药 总 体 疗效 虽然 
比 对 照 药 差 , 但 两 药 总 体 疗效 之 差 小 于 A。 拒 绝 了 原 假 设 便 可 得 出 试验 药 比 对 照 药 非 劣 效 的 
结论 。 

1. 非 劣 效 性 界 值 的 确定 ”临床 非 劣 效 性 试验 的 一 个 重要 问题 是 非 劣 效 界 值 的 确定 。 非 劣 
效 性 界 值 A 是 一 个 有 临床 意义 的 值 , 车 A 选择 过 大 , 可 能 会 接受 疗效 达 不 到 要 求 的 药物 ; 若 A 
选择 过 小 , 则 可 能 无 法 获得 非 劣 效 结果 。 统 计 学 上 , A 的 确定 一 般 采 用 两 步 法 , 先 估计 出 阳性 
对 照 (以 安奈 剂 为 对 照 ) 的 绝对 疗效 Mi , 再 根据 M 确定 出 A。A 是 由 主要 研究 者 和 统计 学 专 
家 根据 既往 研究 或 循 证 医学 证 据 共同 确定 的 , 最 终 由 主要 研究 者 确认 。M, 的 确定 采用 综合 
析 法 , 其 中 最 常用 的 是 meta 分 析 法 (可 参考 有 关 书 籍 ), 即 计算 出 阳性 对 照 与 安奈 剂 效应 之 差 
的 95% 双 侧 置信 区 间 下 限 。 获 得 Mi 后 , 非 劣 效 界 值 取 A=fMi( 建 议 取 f=0.5)。f 值 越 接 近 0， 
越 不 容易 得 出 显著 性 结论 。 如 果 没 有 历史 资料 可 供 参 考 , A 值 可 由 研究 者 根据 实际 临床 意义 
决定 。 

2. 非 劣 效 检验 方法 ” 非 劣 效 性 检验 可 以 通过 假设 检验 方法 进行 统计 推断 , 其 原 假设 为 厂 : 
CT>A, 本 :CT<A, 其 中 C 和 7 分 别 为 标准 对 照 组 和 试验 组 的 效应 值 。 更 简单 的 方法 是 通 
过 置信 区 间 估 计 进 行 统计 推断 , 即 按照 单 侧 1 一 a 可 信 度 , 计算 标准 对 照 组 与 试验 组 效应 差 值 的 
置信 区 间 , 若 置 信 区 间 的 上 限 C,<A 则 可 下 非 劣 效 的 结论 。 例 如 , 某 项 研究 得 出 的 标准 对 照 组 
与 试验 组 两 组 有 效率 差 值 的 单 侧 97.5% 的 置信 区 间 为 (- % , 0.12 ), 而 预先 规定 的 非 劣 效 界 值 
A=0.10, Cu>A, 按照 a=0.025 的 检验 水 准 , 不 能 得 出 试验 组 非 劣 于 对 照 组 的 结论 。 

(三 ) 等 效 性 试验 

对 于 等 效 性 检验 , 只 需要 在 两 个 方向 上 同时 进行 两 次 单 侧 检 验 , 如 果 两 个 原 假设 均 被 拒绝 ， 
即 前 者 推论 试验 组 不 比 标准 对 照 组 差 , 后 者 推论 试验 组 不 比 标准 对 照 组 好 , 则 可 以 推断 两 组 具 
有 等 效 性 。 具 体 可 以 按照 1 -a 的 可 信 度 , 计算 两 组 差 值 的 双 侧 置 信 区 间 , 若 置 信 区 间 的 上 下 限 
(Ci, Cu) 完 全 在 (-A,A) 范 围 内 , 则 可 以 下 等 效 性 的 结论 。 


第 四 节 ”样本 含量 估算 


为 了 保证 研究 结论 具有 一 定 可 靠 性 , 常 需要 在 设计 阶段 估算 所 需要 的 最 少 实验 单位 数 , 即 
样本 含量 (sample size)。 样 本 含量 过 小 , 假设 检验 效能 不 够 , 无 法 显现 不 同 处 理 组 间 的 差别 ; 同 
时 样本 含量 也 不 是 越 大 越 好 , 样本 量 过 大 会 增加 研究 的 费用 和 实际 工作 的 困难 , 浪费 人 力 、 物 
力 和 时 间 , 并 且 可 能 影响 数据 的 质量 。 


-、 影 响 样 本 量 的 条 


一 般 来 说 , 统计 学 上 样本 含量 估算 取决 于 四 个 要 素 : 

1. 假设 检验 的 I 类 错误 概率 a 的 大 小 , [类 错误 概率 " 越 小 , 所 需 样 本 含量 越 大 。 

2. 假设 检验 的 了 [类 错误 概率 8 或 检验 效能 1- 的 大 小 。 一 般 要 求 检 验 效能 最 好 在 0.80 及 
以 上 ,I 类 错误 概率 B 越 小 , 所 需 样本 含量 越 大 。 

3. 总 体 间 差 值 5 的 大 小 。 如 两 总 体 均 数 的 差 值 5=lu 一 yl, 或 两 总 体 率 的 差 值 6= Ix zol。 
5 值 越 小 , 所 需 样本 含量 越 大 。 若 研究 者 无 法 获得 5 的 信息 , 可 通过 查阅 文献 或 预 实验 来 估计 。 

4. 总 体 变异 性 的 大 小 。 均 数 比较 时 需 了 解 个 体 变异 大 小 , 即 总 体 标准 差 o; 率 的 比较 需要 
了 解 总 体 率 z 的 大 小 。o 越 大 或 x 越 接近 50%, 所 需 样本 量 越 大 。 这 些 参数 一 般 未 知 , 可 通过 查 
阅 文 献 或 预 实验 来 估计 。 
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除 上 述 四 个 要 素 外 , 还 需要 注意 : 对 于 设置 安慰 剂 对 照 的 优 < 效 性 研究 , 选取 的 临床 有 效 性 
界 值 A 越 大 , 所 需要 的 样本 含量 越 大 ; 对 于 非 劣 效 性 和 等 效 性 研究 , 选取 的 允许 差别 的 界 值 A 
越 小 , 所 需 样本 含量 越 大 。 

-、 篆 用 的 样本 含量 估算 方法 

样本 含量 的 估算 方法 有 多 种 , 其 公式 往往 是 根据 检验 统计 量 的 公式 , 并 考虑 检验 效能 的 大 
小 , 反 推 而 来 。 原 则 上 , 不 同 的 检验 方法 都 有 确定 的 样本 含量 估算 方法 。 下 面 介绍 假设 检验 中 
常用 的 几 种 方法 。 

1. 样本 均 数 与 总 体 均 数 比较 (或 配对 比较 ) 的 样本 含量 


2 
"| (15-1) 


式 中 ,n 为 所 需要 的 样本 含量 , 配对 设计 时 为 对 子 数 ;6 为 总 体 差 值 ; o 为 总 体 标准 差 (配对 设 
计 为 04); zu 为 标准 正 态 分 布 的 双 侧 临界 值 ; 单 侧 检验 时 , 可 改 为 单 侧 临界 值 xs; zj 为 标准 正 态 
分 布 的 单 侧 临 界 值 。 

例 15-3 研究 维生素 下 缺 乏 时 对 肝 中 维生素 A 含量 的 影响 , 将 大 白鼠 配对 后 分 为 两 组 , 分 
别 喂 以 正常 饲料 和 维生素 E 缺乏 饲料 。 已 知 其 标准 差 为 550IU/g, 若 肝 中 维生素 含量 A 差异 为 
700IU/g 在 专业 上 认为 有 意义 , 取 a=0.05, B=0.05, 需 要 多 大 样本 量 ? 

本 例 o=550,5=700, z00sp=1.96, z00s=1.64 


"| RR 
700/550 | 





即 需 要 16 只 大 白鼠 配 成 8 对 。 
2. 两 组 样本 均 数 比较 的 样本 含量 


Zo + 2p 


EE 上 -1 a 
n | 77 | + (15-2) 


式 中 zp、zp 含义 同上 。0 与 ,为 样本 比例 , 即 O91=n1n， Qs=j1n,n=m+h2o 车 =n2, 则 
Q1=Q,=0.5。 

例 15-4 和 欲 比较 A、B 两 种 药物 对 四 氧 喀 啶 糖尿 病 模型 小 鼠 的 降 血糖 作用 。 假 设 两 药 使 得 
空腹 血糖 下 降 值 相差 2.76mmolL 及 以 上 有 专业 意义 ,车 o=1.70mmol/L, a 取 双 侧 0.05, 检验 效 
能 为 0.90, 每 组 例 数 相等 , 问 每 组 需要 多 少 只 小 鼠 ? 若 B 组 的 样本 量 是 A 组 的 两 倍 , 则 每 组 又 
各 需要 多 少 只 小 鼠 ? 

本 例 o=1.70,5=2.76， Zo0sn 二 1.96, z010= 1.282; 若 两 组 样本 含量 相等 , 则 O=O=0.5, 可 
算得 

2 2 
mi=j2=16/2=8, 即 每 组 需要 8 只 小 鼠 。 

若 B 组 的 样本 量 是 A 组 的 两 倍 , 即 9,=1/3, 0,=1-0,=2/3, 则 


于 . ' 
-| se :| CO + 97) -| 2 | [1/3)7'+(2/3] ~18 


故 A 组 需 m=Qin=1/3x18=6 只 ;B 组 需 h=Qxn=2/3x18=12 只 。 


IE 
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可 以 证 明 , 如 果 其 他 条 件 相同 , 当 两 组 样本 含量 相同 时 , 所 需要 的 样本 含量 最 少 。 
3. 两 样本 率 检验 的 样本 含量 





za Tr OQ" + Ota Nn-a)/Q tA a/ | 


Ti— x 





(15-3) 


式 中 x 为 两 总 体 合计 概率 ,z= Qn + Qzn， 其 中 zz 和 环 为 两 组 总 体 率 , 2, 与 2: 为 样本 比例 , 即 
Qi=nm/n, OQ,=n2/n, n=n+n, Za 和 了 符号 意义 同 前 。 

例 15-5” 欲 比较 甲 . 乙 两 种 药物 治疗 心肌 梗死 溶 栓 的 效果 , 预 试 验 甲 组 溶 栓 的 有 效率 为 94%， 
乙 组 溶 栓 的 有 效率 为 85%。 若 取 双 侧 a=0.05, 单 侧 8=0.10, 甲 药 组 的 样本 含量 占 60%, 乙 药 组 
占 40%, 试问 比较 两 组 有 效率 是 否 有 差别 各 需要 多 少 例 样本 ? 

本 例 z=0.94, z=0.85, QO1=0.60, OQ,=0.40, zo005n 一 1.96, zp=Z010= 1.282, x.=0.60 x 0.94+ 
0.40 x 0.85=0.904 
代入 式 (15-3 ) 得 











2 
| zd TaNO + OO) tz Van)/O + rl 7)/O, 


， 石 一石 











2 
[ea —0.904)(0.60 +0.407) +1.282V0.94 (1—0.94)/0.60 +0.85(1—0.85)/0.40 | 
0.94 一 0.85 


495 








故 甲 药 组 需 加 =Qn=0.60x495=297 例 患者 , 乙 药 组 需要 n=Qn=0.40x495=198 例 患 者 。 





练习 题 


一 、 单 项 选择 题 
| 1 实验 性 研究 随机 化 分 组 的 目的 是 (。 ) 
A. 减少 抽样 误差 B. 减少 实验 例 数 
| C. 提高 检验 效能 D. 提高 检验 准确 度 
E. 保持 各 组 的 非 处 理 因素 均衡 一 致 
| 2 关于 实验 指标 的 准确 度 和 精密 度 , 正确 的 说 法 是 (。 ) 
A. 精密 度 较 准确 度 更 重要 开光 生生 
共度 主要 受 随机 误差 的 影响 D. 准确 度 主要 受 随机 误差 的 影响 


iD 










E. 精密 度 包含 准确 度 
3. 在 临床 试验 设计 选择 对 照 时 ,最 高 效 的 对 照 形式 是 ( ) 

| A. 历史 对 有 昭 B. 空白 对 照 
C. 标准 对 照 D. 安慰 剂 对 照 
| E. 自身 对 照 
| 4. 实验 设计 的 三 大 原则 是 ( ) 

A. 随机 、 对 照 、 言 法 B. 随机 、 均 衡 、 重 复 

C. 随机 、 对 照 、 均 衡 D. 对 照 、 重 复 、 样 本 大 小 


E. 随机 、 对 照 、 重 复 
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5. 茶 医 师 研究 茶 新 药 治疗 缺 血 性 脑 辛 中 恢复 期 的 临床 疗效 ,对 照 组 采用 阳性 药物 溶 检 胶 


膏 ; 这 属于 (  ) 
A. 空白 对 照 B. 历史 对 照 
C. 标准 对 照 D. 安慰 剂 对 照 


E. 实验 对 照 

6. 估计 样本 蝇 时 ,在 其 他 条 件 不 变 时 , 设 定 的 了 [类 错误 概率 念 小 , 则 (  ) 
A. 所 需 的 样本 量 念 小 B. 所 需 的 样本 量 念 大 
C. 不 影响 样本 量 大 小 D. 样本 量 的 估计 念 准确 
E. 样本 蝇 的 估计 念 不 准确 

7. 阳性 药 为 对 照 的 临床 非 劣 效 性 试验 中 , 原 假设 把 是 ( ”) 


A C=7EA B: 去 一 个 > 从 
& Ts-A DBD: 下 一 名 > 从 
EB: ZsA 


8. 下 列 关于 随机 化 的 叙述 ,不 正确 的 是 ( ) 

A. 随机 化 可 以 避免 结果 出 现 偏 倚 

B. 随机 化 是 统计 推断 的 前 提 
C. 随机 化 可 以 使 各 组 非 处 理 因素 的 分 布 尽量 保持 均衡 一 致 
D. 随机 化 可 以 防止 研究 者 人 为 影响 研究 结果 
E 
| 





. 随机 化 可 以 减少 随机 误差 





9. 临床 试验 采用 双 育 法 的 重要 意义 是 ( ) 
A. 便于 试验 实施 B. 减少 患者 在 试验 中 脱落 
C. 防止 出 现 过 大 的 随机 误差 D. 减少 混杂 因素 的 影响 
E. 减少 试验 中 的 偏 倚 

10. 临床 试验 需要 在 设计 阶段 确定 主要 指标 的 目的 是 ( ) 






A. 便于 试验 实施 B. 减少 测量 的 随机 误差 

C. 减少 非 处 理 因素 的 影响 D. 避免 结果 的 任意 性 

E. 更 好 地 提高 检验 效能 
二 、 计 算 与 分 析 

1. 和 欲 比较 甲 、 乙 两 种 药物 治疗 心肌 梗死 溶 栓 的 效果 , 预 试验 甲 组 溶 栓 的 有 效率 为 
95%, 乙 组 溶 栓 的 有 效率 为 855%。 若 取 双 侧 wa=0.05,8=0.10, 两 组 病例 数 相 同 的 情况 下 ， 
临床 试验 每 组 最 少 需 观察 多 少 病例 ? 

2. 为 研究 双 歧 杆菌 辅助 治疗 新 生 儿 高 胆 红 素 血 症 的 疗效 ,对 试验 组 和 对 照 组 经 皮 
测 胆 红 素 下 降 值 进行 比较 。 假 定 两 组 标准 差 相 等 ,go=4.5hmol/L，, 并 假设 专业 上 认为 胆 


红 素 下 降 值 相差 2.5hmol/L 有 意义 ,车 试验 组 与 对 照 组 样本 伟 量 的 比例 为 2:1, 现 规定 
| 4=0.05,pB=0.10, 做 双 侧 检验 对 照 组 需要 多 少 病例 才能 发 现 差异 ? 





3. 为 探讨 天 然 牛 磺 酸 对 高 铅 动 物 模型 铅 含量 的 影响 , 将 实验 大 白鼠 模型 随机 分 到 牛 
磺 酸 组 和 不 使 用 药物 的 对 照 组 。 预 实验 结果 : 给 药 24 小 时 后 , 测 得 两 组 动物 血 铅 含 量 均 
值 分 别 为 2.40hg/L 和 3.45hg/L, 两 组 合并 标准 差 为 0.60hg/L。 藻 取 ac=0.05,B=0.10, 要 得 
到 两 组 血 铅 含量 不 同 的 结论 ( 双 侧 检验 ), 试 估计 每 组 需要 多 少 只 实验 大 白 扎 模型 ? 

4. 为 确定 一 种 降 脂 药物 的 起 始 用 药剂 量 , 将 30 便 新 诊断 的 高 血脂 患者 按 就 诊 的 先后 
顺序 依次 分 入 低 .中 、 高 三 个 剂量 组 , 经 一 段 时 间 治 疗 后 , 通过 比较 三 组 患者 的 治疗 后 低 密 
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| 度 脂 蛋白 变化 值 来 选择 该 降 脂 药 的 剂量 。 请 根据 以 上 描述 回答 : 
(1) 在 这 项 研究 中 , 研究 的 三 要 素 分 别 是 什么 ? 
(2) 请 从 实验 设计 角度 对 此 项 研究 进行 评价 , 并 对 此 研究 设计 提出 改进 意见 





( 贺 ” 佳 ) 





附录 1 CONSORT statement-RCT 研究 报告 的 信息 (2010) | 





[这 机 临床 试验 CONSORT 2010 对 照 检 查 清单 





论文 章节 /主题 ”条 目 号 对 照 检 查 的 条 目 
文 题 和 摘要 





la 文 题 能 识别 是 随机 临床 试验 
lb 结构 式 摘要 , 包括 试验 设计 、 方 法 、 结 果 、 结 论 几 个 部 分 (具体 的 指导 建议 参见 “CONSORT 


for abstracts” ) 




















引言 
背景 和 目的 2a 科学 背景 和 对 试验 理由 的 解释 
2b 具体 目的 和 假设 
方法 
试验 设计 3a 描述 试验 设计 (诸如 平行 设计 、 析 因 设计 ), 包括 受 试 者 分 配 入 各 组 的 比例 
3b 试验 开始 后 对 试验 方法 所 作 的 重要 改变 (如 合格 受 试 者 的 挑选 标准 ), 并 说 明 原 因 
受 试 者 4a 受 试 者 合格 标准 
4b 资料 收集 的 场所 和 地 点 
干预 措施 5 详细 描述 各 组 干预 措施 的 细节 以 使 他 人 能 够 重复 , 包括 它们 实际 上 是 在 何 时 、 如 何 
实施 的 
结局 指标 6a 完整 而 确切 地 说 明 预先 设 定 的 主要 和 次 要 结局 指标 , 包括 它们 是 在 何 时 、 如 何 测评 的 
6b 试验 开始 后 对 结局 指标 是 否 有 任何 更 改 , 并 说 明 原因 
样本 量 7a 如 何 确定 样本 量 
7b 必要 时 , 解释 中 期 分 析 和 试验 中 止 原则 
随机 方法 : 
序列 的 产生 8a 产生 随机 分 配 序列 的 方法 
8b 随机 方法 的 类 型 , 任何 限定 的 细节 (如 怎样 分 区 组 和 各 区 组 样本 多 少 ) 
分 配 隐 藏 机 制 9 用 于 执行 随机 分 配 序列 的 机 制 (例如 按 序 编码 的 封 藏 法 ), 描述 干预 措施 分 配 之 前 为 
隐藏 序列 号 所 采取 的 步骤 
实施 10 谁 产生 随机 分 配 序列 , 谁 招募 受 试 者 , 谁 给 受 试 者 分 配 干预 措施 
育 法 11a 如 果实 施 了 育 法 , 分 配 干 预 措施 之 后 对 谁 设 育 (例如 受 试 者 、 医 护 提供 者 、 结 局 评估 


者 ), 以 及 育 法 是 如 何 实施 的 
11b ”如 有 必要 , 描述 干预 措施 的 相似 之 处 
统计 学 方法 12a ”用 于 比较 各 组 主要 和 次 要 结局 指标 的 统计 学 方法 
12b 附加 分 析 的 方法 , 诸如 亚 组 分 析 和 校正 分 析 
结果 
受 试 者 流程 (极力 13a ”随机 分 配 到 各 组 的 受 试 者 例 数 , 接受 已 分 配 治疗 的 例 数 , 以 及 纳入 主要 结局 分 析 的 例 数 
推荐 使 用 流程 图 ) 13b ”随机 分 组 后 , 各 组 脱落 和 被 剔除 的 例 数 , 并 说 明 原因 


招募 受 试 者 14a 招募 期 和 随访 时 间 的 长 短 , 并 说 明 具体 日 期 
14b 为 什么 试验 中 断 或 停止 
基线 资料 - 15 用 一 张 表格 列 出 每 一 组 受 试 者 的 基线 数据 ,包括 人 口 学 资料 和 临床 特征 
纳入 分 析 的 例 数 16 各 组 纳入 每 一 种 分 析 的 受 试 者 数目 (分 母 ), 以 及 是 否 按 最 初 的 分 组 分 析 
结局 和 估计 值 17a 各 组 每 一 项 主要 和 次 要 结局 指标 的 结果 ,效应 估计 值 及 其 精确 性 (如 95% 可 信 区 间 ) 


17b 对 于 二 分 类 结局 , 建议 同时 提供 相对 效应 值 和 绝对 效应 值 
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论文 章节 /主题 ”条目 号 对 照 检查 的 条 目 

辅助 分 析 18 所 做 的 其 他 分 析 的 结果 , 包括 亚 组 分 析 和 校正 分 析 , 指出 哪些 是 预先 设 定 的 分 析 , 哪 
些 是 新 尝试 的 分 析 

危害 19 各 组 出 现 的 所 有 严重 危害 或 意外 效果 (具体 的 指导 建议 参见 “CONSORT for harms” ) 

讨论 

局 限 性 20 试验 的 局 限 性 , 报告 潜在 偏 倚 和 不 精确 的 原因 , 以 及 出 现 多 种 分 析 结 果 的 原因 ( 如果 
有 这 种 情况 的 话 ) 

可 推广 性 21 试验 结果 被 推广 的 可 能 性 (外 部 可 靠 性 , 实用 性 ) 

解释 22 与 结果 相对 应 的 解释 , 权衡 试验 结果 的 利兹 ,并 且 考 虑 其 他 相关 证 据 

其 他 信息 

试验 注册 23 临床 试验 注册 号 和 注册 机 构 名 称 

试验 方案 24 如 果 有 的 话 , 在 哪里 可 以 获取 完整 的 试验 方案 

资助 25 资助 和 其 他 支持 (如 提供 药品 ) 的 来 源 , 提供 资助 者 所 起 的 作用 





注 : 我 们 极力 推荐 结合 “CONSORT 2010 说 明 与 详 述 "阅读 本 声明 , 那 份 文件 对 全 部 条 目 作 了 详细 阐述 。 我 们 还 推荐 必要 时 阅读 关 
于 群 组 随机 试验 、 非 劣 效 性 和 等 效 性 试验 、 非 药物 治疗 、 草 药 干预 以 及 实效 性 试验 的 各 种 CONSORT 扩展 版 。 与 本 清单 有 关 的 各 种 扩展 
版 及 最 新 参考 资料 ,请 见 www.consort-statement.org。 
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不 接受 分 配 的 干预 的 例 数 (给 出 原因 ) 不 接受 分 配 的 干预 的 例 数 (给 出 原因 ) 
Y 随访 
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终止 干预 的 例 数 (给 出 原因 )(n= ) 终止 干预 的 例 数 (给 出 原因 )(n= ) 








| | 


纳入 分 析 的 例 数 (n= ) 纳入 分 析 例 数 (n= ) 
分 析 时 被 剔除 的 例 数 (给 出 原因 )(n= ) 分 析 时 被 剔除 的 例 数 (给 出 原因 )(x= ) 





























以 上 全 部 内 容 来 源 :(D Schulz KF, Altman DG, Moher D,for the CONSORT Group. CONSORT 2010 Statement: updated 
guidelines for reporting paralle] group randomised trials. Ann Int Med, 2010: 152. ©® Moher D, Hopewell S, Schulz KF, Montori 
V, Cotzsche PC, Devereaux PJ, Elbourne D, Egger M, Altman DG, for the CONSORT Group. CONSORT 2010 Explanation 
and Elaboration: updated guidelines for reporting parallel group randomised trial. BMJ, 2010, 340: c869. (http://www.consort- 


statement.org/consort-statement/ ) 





附录 2 SPSS 统计 软件 上 机 实习 


1. 概述 


SPSS( statistical package for the social sciences ) 为 “社会 科学 统计 软件 包 ”, 由 美国 斯 坦 福 大 学 的 三 位 研究 
生 于 20 世纪 60 年 代 末 研制 , 目前 已 成 为 非 专业 统计 人 员 的 首选 统计 软件 。SPSS 最 突出 的 特点 就 是 操作 界 
面 友好 , 输出 结果 美观 。SPSS 使 用 Windows 的 窗口 方式 展示 各 种 功能 , 使 用 对 话 框 展示 功能 选择 项 , 对 于 使 
用 Windows 的 用 户 , 只 要 了 解 统计 分 析 方法 , 就 可 以 方便 地 使 用 该 软件 为 特定 的 科研 工作 服务 。SPSS 在 全 
球 的 用 户 分 布 于 通信 、 医 疗 、 银 行 \、 证 券 、 保 险 、 制 造 、 商 业 、 科 研 教育 等 多 个 领域 和 行业 , 是 世界 上 应 用 最 广 
泛 的 专业 统计 软件 之 一 。 本 书 采用 SPSS17.0。 

SPSS 的 基本 界面 和 常用 功能 简介 如 下 : 

(1) SPSS 的 基本 界面 : 对 于 非 统计 专业 的 使 用 者 , SPSS 的 基本 界面 包括 两 个 常用 窗口 : 数据 编辑 窗口 
(Data Editor ) 和 结果 输出 窗口 (Viewer)。 分别 如 附 图 1、 附 图 2 所 示 。 
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附 图 1 数据 编辑 窗口 





数据 编辑 窗口 主要 用 于 研究 数据 的 录入 、 编 辑 和 显示 , 以 及 数据 集中 相关 变量 名 、 变 量 标签 、 变量 届 性 
的 定义 和 修改 。 数 据 编辑 窗口 由 数据 视图 (Data View) 和 变量 视图 ( Variable View ) 两 个 窗口 组 成 , 两 者 之 间 
可 以 互相 切换 。 数 据 文件 的 创建 与 保存 详 见 2.1 节 。 

结果 输出 窗口 会 在 分 析 后 自动 打开 , 显示 程序 运行 后 的 所 有 结果 。 多 个 数据 文件 的 分 析 结 果 将 显示 在 
同一 个 结果 输出 窗口 中 。 双 击 某 部 分 的 结果 可 以 对 其 显示 的 样式 进行 编辑 。 结 果 文件 可 以 保存 , 其 扩展 名 
为 “spo”o 
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划 output1 [Docuaent1] - PAS 豆 Statistic 
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附 图 2 ”结果 输出 窗口 


(2) SPSS 的 常用 统计 分 析 功 能 : SPSS 提供 了 所 有 常用 的 、 较 为 成 熟 的 统计 描述 与 统计 分 析 过 程 , 大 部 分 
统计 方法 都 在 Analyze 菜单 中 列 出 , 可 以 满足 非 统计 专业 研究 的 基本 统计 分 析 需 要 。 如 附 图 3 所 示 。 具 体 的 
统计 分 析 过 程 将 在 本 章 第 2 部 分 进行 详细 介绍 。 
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附 图 3 ”SPSS 的 分 析 菜 单 
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2. 统计 功能 的 实现 
2.1 数据 文件 的 建立 


建立 数据 文件 是 采用 SPSS 开始 工作 的 第 一 步 , 主要 是 指 把 医学 科研 工作 过 程 中 采集 的 研究 数据 (Data ) 
按照 SPSS 软件 的 格式 要 求 存 人 到 计算 机 的 磁盘 中 , 以 便 调 用 、 修 改 、 分析 。SPSS 采用 类 似 Excel 表格 的 方式 
输入 与 管理 数据 , 也 可 以 直接 导入 Excel、Text、dBASE、SAS、Stata 等 数据 集 。 在 SPSS 中 创建 新 的 数据 集 时 ， 
通过 “File” 一 “New” 一 “Data” 打开 数据 编辑 窗口 后 创建 。SPSS 数据 集 的 扩展 名 为 “sav 。 

为 了 建立 和 使 用 数据 集 时 方便 , 建议 用 户 创建 新 数据 集 时 ,分 两 步 进行 : 

(1) 定义 数据 集 的 框架 : 即 先进 行 数据 集中 涉及 的 所 有 变量 的 定义 , 包括 变量 名 、 变 量 标 签 、 变 量 属性 等 。 
变量 的 定义 在 数据 编辑 窗口 (Data Editor) 的 变量 视图 (Variable View) 中 完成 。 如 附 图 4 所 示 。 
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附 图 4 变量 视图 


在 变量 视图 中 , 双击 第 一 行 的 空白 单元 格 , 即 可 定义 变量 名 (Name)、 类 型 (Type)、 宽度 (Width)、 小 数 点 
位 数 (Decimals )、 变 量 标签 (Label)、 变量 值 标签 (Values ) 等 。 

其 中 , 变量 名 就 是 所 研究 的 指标 在 软件 中 可 被 识别 的 名 称 , 通常 由 用 户 自己 定义 。 定 义 时 需 遵 守 SPSS 
软件 的 变量 名 命名 规则 , 否则 将 无 法 被 识别 或 者 报错 。SPSS 中 变量 名 的 命名 规则 为 : 最 长 为 64 个 字 
节 ; @ 以 字母 或 汉字 开头 ,不 能 以 ““” 或 “” 结 尾 , 其 中 不 能 有 空格 、 通 配 符 或 某 些 特殊 字符 , 如?、*、!、, 等 ; 
@ 变 量 名 须 唯一 , 不 区 分 大 小 写 ; @ 变 量 名 不 能 与 SPSS 的 系统 关键 词 相同 , 不 能 使 用 逻辑 关系 运算 符 ALL、 
AND 、OR 等 , 如 果 输 入 了 系统 关键 词 , 则 系统 会 提示 错误 。 下 面 , 我 们 以 “性 别 "( 变 量 名 : gender) 这 一 常见 
的 名 义 变量 为 例 , 简 述 新 变量 的 定义 过 程 。 

如 附 图 5 所 示 , 录入 了 “gender” 这 一 变量 名 后 , 后面 的 各 个 属性 会 出 现 默认 值 , 用 户 可 根据 变量 的 具 
体 性 质 进行 修改 , 变量 标签 除外 。 单 击 要 修改 的 单元 格 后 , 有 的 单元 格 后 会 出 现 “…”, 表明 系统 提供 了 备 
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选项 , 如 在 变量 类 型 中 单 击 “...” 后 ,就 会 弹出 对 话 框 , 显示 SPSS 软件 所 提供 的 8 种 变量 类 型 : 标准 数值 型 
(Numeric )、 人 逗号 数值 型 (Comma)、 加 点 数值 型 (Dot)、 科学 记 数 (Scientific notation )、 日 期 型 (Date)、 自 定 义 
(Custom currency )、 字 符 型 (String)。 最 常用 的 是 标准 数值 型 日 期 型 、 字 符 型 三 种 ,为 了 分 析 方 便 , 大 多 数 医 


学 研究 的 变量 都 会 被 定义 成 标准 数值 型 。 
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附 图 5 在 变量 视图 中 定义 新 变量 


变量 标签 (Label ) 是 对 所 对 应 的 变量 的 说 明 , 可 以 为 中 文 , 如 本 例 中 ,我 们 将 变量 名 设置 为 “gender”, 此 
时 ,可 将 变量 标签 设置 为 “性 别 ”, 以 便 使 用 数据 集 的 用 户 能 清楚 地 了 解 变量 的 具体 含义 。 一 些 分 类 资料 的 
具体 赋值 情况 则 可 通过 变量 值 标签 (Values ) 进 行进 一 步 的 定义 , 变量 值 标签 也 就 是 对 变量 赋值 的 说 明 。 

附 图 6 所 示 即 为 对 变量 值 标签 进行 定义 的 窗口 。 例 如 gender 这 一 变量 , 赋值 1 代表 男性 , 2 代表 女性 ， 
定义 变量 值 标签 时 , 可 以 单 击 变量 值 标 签单 元 格 中 的 “…”, 在 弹出 的 对 话 框 中 ( 附 图 6), 取 值 (Value ) 处 键 和 人 
“1”, 标签 (Label) 处 键入 “男性 ”, 单 击 添加 (Add) 后 , 显示 “1= 男 性 ”, 即 完成 了 一 条 变量 值 标签 的 定义 ,同样 
的 操作 可 定义 “2= 女性 "。 变 量 值 标签 的 定义 可 以 帮助 使 用 者 对 数据 集 有 更 好 地 了 解 , 也 为 日 后 使 用 数据 集 


提供 了 方便 。 
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附 图 6 定义 变量 值 标签 
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定义 好 一 个 变量 的 信息 后 , 双击 其 下 面 的 一 行 即 可 进行 新 变量 的 定义 。 如 附 图 7 所 示 , 定义 了 性 别 
(gender)、 年 龄 (age)、 身 高 (height)、 体 重 (weight)、 病 情 (status ) 等 5 个 变量 。 其 中 ， 病情 的 变量 值 标 签 定义 为 
不 同 的 严重 程度 : 1= 轻 ,2= 中 ,3= 重 。 
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5 status Numeic 8 0 病情 [Ere 8 济 Right | 
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附 图 7 ”变量 视图 中 定义 好 的 5 个 变量 





(2) 数据 录入 : 变量 名 及 其 属性 定义 好 之 后 , 就 可 以 切换 到 数据 视图 (Data View) 中 进行 数据 录入 了 。 此 
时 ,各 列 的 列 名 已 经 变 成 了 刚才 定义 好 的 变量 名 。 所 采集 的 数据 按照 一 个 观测 对 象 一 行 的 顺序 录入 。 如 ， 
采集 了 20 名 患者 的 基本 资料 , 录入 好 的 数据 集 将 如 附 图 8 所 示 。 
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附 图 8 20 名 患者 的 基本 资料 


(3) 数据 集 的 保存 : 建立 好 新 的 数据 集 之 后 , 可 以 点 击 “File” 一 “Save"” 在 弹出 的 对 话 框 中 选择 要 保存 文 
件 的 路 径 , 在 “File name” 后 面 键 人 数据 集 的 名 称 , 点 击 “Save" 即 可 。 如 附 图 9 所 示 。 本 例 ， 数据 集 的 名 称 为 
“患者 基本 情况 .sav”, 保存 在 “桌面 "上 。 
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附 图 9 数据 集 的 保存 对 话 杠 


2.2 ”统计 特征 计算 


变量 统计 特征 的 计算 是 收集 好 资料 进行 统计 分 析 的 第 一 步 。 下 面 , 以 例 2-6 为 例 , 介绍 描述 计量 资料 集 
中 趋势 和 离散 趋势 的 统计 指标 。 
例 2-6 的 数据 录入 如 附 图 10 所 示 , 每 列表 示 一 位 患者 , 一 行 表示 该 患者 一 天 的 收缩 夺 : 
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附 图 10 两 名 患者 测 得 的 5 天 收缩 压 


统计 描述 指标 的 输出 可 通过 “Analyze” 一 “Descriptive Statistics” 一 “Explore...” 实现 。 弹 出 的 对 话 框 如 附 
图 11 所 示 。 

选择 要 进行 统计 描述 的 变量 , 单 击 按钮 “ 哆 ", 将 变量 选 人 到 “Dependent List” 列表 框 , 点 击 “Statistics”， 
在 弹出 的 对 话 框 中 选择 “Descriptives” 和 “Percentiles”, 即 可 得 到 计量 资料 常用 的 统计 描述 指标 。 如 附 图 12 


所 示 。 
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附 图 11 ”Explore 对 话 框 附 图 12 ”Explore 中 的 Statistics 对 话 框 





例 2-6 的 输出 结果 如 下 : 




















Descriptives 
Statistic Std. Error 

甲 患者 收缩 压 Mean 162.6000 8.715 50 
95% Confidence Interval for Mean ”Lower Bound 138.4019 
Upper Bound 186.7981 
5% Trimmed Mean 162.4444 
Median 162.0000 
Variance 379.800 
Std. Deviation 19.488 46 
Minimum 142.00 
Maximum 186.00 
Range 44.00 
Interquartile Range 38.50 

Skewness 28 .913 

Kurtosis =2.522 2.000 

乙 患 者 收缩 压 。 ”Mean 162.4000 | 1.28841 
95% Confidence Interval for Mean Lower Bound 158.8228 
Upper Bound 165.9772 
5% Trimmed Mean 162.3889 
Median 163.0000 
Variance 8.300 
Std. Deviation 2.88097 
Minimum 159.00 
Maximum 166.00 
Range 7.00 
Interquartile Range 5.50 

Skewness 一 038 D3 

Kurtosis —1.804 2.000 











其 中 ,“Mean” 为 均 数 ,“Median” 为 中 位 数 ,“Variance” 为 方差 , “Std. Deviation” 为 标准 差 ,“Minimum” 为 
最 小 值 ,“Maximum” 为 最 大 值 , “Range” 为 极 差 ,“Interquartile Range” 为 四 分 位 数 间 距 。 对 于 服从 正 态 分 布 的 
变量 , 通常 采用 均 数 和 标准 差 进行 统计 描述 , 而 非 正 态 资料 则 采用 中 位 数 和 四 分 位 数 间 距 描述 。 本 例 , 甲 患 
者 5 天 收缩 奈 的 平均 值 为 162.6mmHg, 标准 差 为 19.49mmHg; 乙 患者 5 天 收缩 压 的 平均 值 为 162.4mmHg， 标 
准 差 为 2.88mmHg。 可 见 , 甲 、 乙 两 患者 收缩 压 集中 趋势 相近 , 但 甲 患者 5 天 收缩 压 的 变异 水 平 较 大 。 


3 


附录 2 SPSS 统计 软件 上 机 实习 


2.3 ” 画 统 计 图 


对 于 绘制 常用 的 统计 图 , 较为 简便 的 方法 可 通过 “Graphs” 一 “Legacy Dialogs” 中 选择 不 同类 型 的 图 实现 。 
以 下 结合 第 五 章 的 例子 分 别 进行 说 明 。 
2.3.1 直方 图 

根据 某 市 某 年 150 名 3 岁 女孩 身高 频数 表 ( 见 表 5-11 ) 绘 制 成 频数 分 布 图 。 数 据 录入 如 附 图 13 所 示 。 
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Visible: 2 of 2 Variables 
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附 图 13 ” 表 5-11 对 应 的 数据 集 








由 于 SPSS 软件 是 针对 原始 资料 输出 直方 图 的 , 因此 对 于 表 5-11 的 频数 表 资 料 , 可 先 根 据 “ 频 数 ”对 “ 身 
高 ”数据 进行 加 权 。 通 过 “Data” 一 “Weight Cases.….” 实现。 如 附 图 14 所 示 , 点 击 “Weight cases by”, 将 “频数” 
选 入 “Frequency Variable” 列表 框 中 ,点击 “Ok”。 

直方 图 的 输出 可 通过 “Graphs” — “Legacy Dialogs” — “Histogram...” 实现 。 弹 出 的 对 话 框 如 附 图 15 所 示 。 
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附 图 14 ”数据 加 权 对 话 框 附 图 15 ”Histogram 对 话 框 
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选择 观测 变量 “身高 ”, 单 击 按钮 “中 ”, 选 入 到 “Variable" 列 表 框 , 点 击 “Ok”, 即 可 得 到 原始 的 直方 图 。 
选中 该 直方 图 后 , 双击 即 可 进入 编辑 状态 。 需 要 对 图 的 某 个 部 分 进行 自 定义 时 , 只 需 选 中 该 部 分 后 双击 即 
可 进行 定义 。 例 如 : 要 对 横 坐 标的 刻度 进行 修改 , 可 选中 横 坐 标 , 双击 后 , 在 弹出 的 “Properties” 对 话 框 中 选 
择 “Scale” 标签 页 实现 。 

编辑 后 输出 的 直方 图 如 附 图 16 所 示 。 
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附 图 16 ” 某 市 某 年 150 名 3 岁 女孩 身高 频数 分 布 


当 需 绘制 表 5-12 所 对 应 的 分 群 金字 塔 图 (population pyramid ) 时 数据 录入 如 附 图 17 所 示 。 其 中 ， 
“HbAlc” 为 各 个 组 段 的 下 限 ,'f 为 各 组 段 的 频数 , “组 别 ” 区 别 不 同 的 患者 类 型 。 
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附 图 17 表 5-12 对 应 的 数据 集 


同一 般 的 直方 图 绘制 一 样 ,绘制 分 群 金字 塔 图 时 ,需要 先 对 数据 加 权 , 加 权 的 方法 同 附 图 14, 本 例 权重 
变量 为 “f"。 

分 群 金字 塔 图 的 输出 可 通过 “Graphs" 一 “Legacy Dialogs" 一 “Population Pyramid.…… 实现 。 在 弹出 的 对 话 
框 中 选择 “Compute counts from data”, 选中 “HbAle”, 单 击 按钮 “加 ”, 选 入 到 “Show Distribution over: ” 框 , 选 
中 “组 别 ”, 单 击 按钮 “号 ”, 选 和 到"Split by:" 框 中 。 如 附 图 18 所 示 。 

点 击 “OK" 可 得 到 原始 的 分 群 金字 塔 图 , 双击 图 形 后 可 进行 编辑 , 选中 并 双击 需 修改 的 部 分 后 , 输出 的 
分 群 金字 塔 图 如 附 图 19 所 示 。 
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附 图 18 分 层 金字 塔 图 对 话 杠 


糖尿 病 患 者 正常 对 昭 
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附 图 19 糖尿病 患者 和 正常 对 照 HbA1c(% ) 的 频数 分 布 


2.3.2 ” 线 图 
根据 某 地 1968 一 1974 年 男女 结核 病死 亡 率 ( 10 万 ) 资 料 ( 见 表 5-13 ) 绘 制 普 通 线 图 。 数 据 录入 如 附 图 


20 所 示 。 其 中 ,“ 性 别 ” 为 分 组 变量 , “死亡 率 ” 为 观测 指标 , “年 份 ”为 观察 的 时 间 。 

线 图 的 输出 可 通过 “Graphs” 一 “Legacy Dialogs” 一 “Line...” 实 现 。 由 于 要 比较 男性 、 女性 的 死亡 率 需 
绘制 复式 线 图 , 因此 ,首先 在 弹出 的 对 话 框 中 选择 “Multiple”, 点 击 “Define”。 再 选择 “Other statistic( e.g- 
mean )”, 把 指标 变量 “结核 病死 亡 率 " 选 信 “Variable” 框 中 , 把 时 间 变 量 “年份 * 选 人 “Category Axis" 框 , 把 分 


组 变量 “性 别 ”" 选 入 “Define lines by” 框 。 如 附 图 21 所 示 。 
点 击 “OK” 可 得 到 原始 的 普通 线 图 , 按 需要 双击 线 图 , 选中 并 双击 需 修改 的 部 分 后 , 输出 的 线 图 如 附 图 





22 所 示 。 
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附 图 21 Define Multiple Line 对 话 框 附 图 22 某 地 1968 一 1974 年 结核 病死 亡 率 (1/10 万 ) 


需 绘制 半 对 数 线 图 时 , 只 需 先 绘制 普通 线 图 ,输出 后 。 选 中 输出 的 普通 线 图 双击 进入 编辑 状态 , 单 击 选 
中 纵 轴 , 再 双击 后 进行 编辑 , 在 弹出 的 属性 选项 卡 中 把 纵 轴 的 尺度 改 为 以 10 为 底 的 对 数 尺度 即 可 得 到 。 具 
体操 作 此 处 不 再 奖 述 。 
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2.3.3” 箱 式 图 
根据 大 白鼠 正常 肝 和 肝 肿 瘤 中 递 甲 氨 酶 (CPM ) 的 活 度 ( 见 表 5-15 ) 绘 制 箱 式 图 。 数 据 录 入 如 附 图 23 所 


示 。 其 中 ,“ 递 甲 氨 酶 活 度 ”为 观测 指标 , “组 别 ” 为 分 组 变量 : 1= 正常 肝 ,2= 肿 瘤 肝 。 


Ene a = SFSSISLREESCSSEE 











附 图 23 ” 表 5-15 对 应 的 数据 集 


箱 式 图 的 绘制 可 通过 “Graphs” 一 “Legacy Dialogs” 一 “Boxplot.……” 实现 。 在 弹出 的 “Boxplot” 对 话 框 中 选 
择 “Simple” 和 “Summaries for groups of cases”, 点 击 “Define”。 在 弹出 的 “Define Simple Boxplot ”对话 框 中 把 “ 递 
四 氨 酶 活 度 ” 选 入 “Variable” 框 中 、 把 “组 别 ” 选 人 “Category Axis” 框 中 o 如 附 图 24 所 示 。 

点 击 “OK” 可 得 箱 式 图 。 如 附 图 25 所 示 , 图 中 箱 体 两 端的 直线 上 下 两 端 分 别 表示 去 除 离 群 点 后 的 最 大 
值 和 最 小 值 。 箱 体 直线 上 方 出 现 的 带 数 字 的 圆 点 , 表示 离 群 值 的 观察 单位 的 编号 , 本 例 , 第 20 例 大 白鼠 取 
值 较 大 , 该 例 属于 肿瘤 肝 组 , 通过 原始 数据 可 查 得 其 递 甲 氨 酶 活 度 为 814(CPM)。 由 附 图 25 可 见 , 大 白鼠 肿 
瘤 肝 中 递 甲 氨 酶 的 活 度 明 显 高 于 正常 肝 中 递 甲 所 酶 的 活 度 , 而 且 数据 的 变异 性 很 大 。 
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附 图 24 ”Define Simple Boxplot 对 话 框 附 图 25 大 白鼠 正常 肝 与 肿瘤 肝 中 递 
甲 氨 酶 的 活 度 (CPM ) 


组 别 








2.3.4 Es 
根据 试验 组 和 对 照 组 6 周 后 血压 的 变化 情况 ( 见 表 5-16 ) 的 数据 进行 介绍 。 数 据 录 入 如 附 图 26 所 示 。 
其 中 , “组 别 ” 为 分 组 变量 , 赋值 为 试验 组 、 对 照 组 ; “血压 变化 值 ” 表示 观测 指标 , “血压 ”赋值 为 舒张 压 、 收 
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第 五 章 图 5-7 所 对 应 的 误差 条 图 的 绘制 可 通过 “Graphs” 一 “Legacy Dialogs” 一 “Bar...” 实现 。 在 弹出 
的 “Bar Charts” 对 话 框 中 选择 “Clustered” 和 “Summaries for groups of cases”, 点 击 “Define”。 在 弹出 的 “Define 
Clustered Bar” 对 话 框 中 ,点击 “Other statistic(e.g. mean), 将 “血压 变化 值 " 选 入 “Variable” 框 中 ， 第 一 个 分 
层 变量 “血压 ” 选 入 “Category Axis" 框 中 ,第 二 个 分 层 变量 “组 别 ” 选 和 人 “Define Clusters by” 框 中 。 如 附 图 27 


所 示 。 


点 击 “Options...”, 在 弹出 的 对 话 框 中 , 选择 “Display error bars”, 并 在 “Error Bars Represent” 下 方 的 框 中 ， 
选择 “Standard error”, 以 使 输出 的 误差 线 代 表 标 准 误 的 大 小 , 可 在 “Multiplier:” 后 的 框 中 键入 需 输 出 几 倍 标 
准 误 , 本 例 定义 为 “1.0”"。 点 击 “Continue”, 最 后 点 击 “OK” 可 得 误差 条 图 。 如 附 图 28 所 示 。 
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附 图 27 ”Define Clustered Bar 对 话 框 


2.3.5” 散 点 图 


血压 变化 值 (mmHg) 





收缩 压 
附 图 28 ”试验 组 和 对 照 组 血 
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压 的 平均 变化 情况 (十 SE) 


根据 高 血脂 患者 载 脂 蛋白 B 与 低 密度 脂 蛋 白 的 关系 ( 见 表 5-17 ) 绘 制 散 点 图 。 数 据 录入 如 附 图 29 所 示 。 
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附 图 29 表 5-17 对 应 的 数据 集 


散 点 图 的 绘制 可 通过 “Graphs” 一 “Legacy Dialogs” 一 “Scatter/Dot” 实现 。 在 弹出 的 “Scatter/Dot” 对 话 框 中 
选择 “Simple scatter”, 点 击 “Define”。 在 “Simple Scatterplot” 对 话 框 中 , 把 指标 “LDL” 选 入 “Y Axis” 框 、 把 指 
标 “Apo_B” 选 入 “X Axis” 框 。 如 附 图 30 所 示 。 


点 击 “OK” 得 到 原始 的 散 点 图 , 按 需 要 进行 编辑 即 可 得 附 图 31。 
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附 图 30 ”Simple Scatterplot 对 话 框 附 图 31 20 名 高 血脂 患者 载 脂 蛋白 B 与 低 密度 
引 蛋 白 关 系 的 散 点 图 





2.3.6” 直 条 图 

单 式 条 图 的 绘制 较为 简单 ,这 里 结合 复式 条 图 进行 介绍 , 单 式 条 图 的 操作 可 参考 进行 。 

根据 某 地 区 1952 年 与 1972 年 三 种 疾病 的 死亡 率 (1/10 万 )( 见 表 5-19) 绘 制 复式 条 图 。 数 据 录 入 如 附 图 
32 所 示 。 

复式 条 图 的 绘制 可 通过 “Graphs” 一 “Legacy Dialogs” 一 “Bar...” 实现 。 在 弹出 的 “Bar Charts” 对 话 框 中 选 
择 “Clustered”( 如 绘制 单 式 条 图 则 选择 “Simple”) 和 “Summaries for groups of cases”, 点 击 “Define”。 在 弹出 的 
“Define Clustered Bar” 对 话 框 中 , 点 击 “Other statistic(e.g. mean)”, 将 “死亡 率 ” 选 入 “Variable” 框 中 ,第 一 个 分 
层 变 量 “死因 ” 选 入 “Category Axis” 框 ,第 二 个 分 层 变量 “年 份 " 选 入“Define Clusters by” 框 中 。 操 作 过 程 与 界 
面 同 本 章 的 节 2.3.4, 只 是 本 例 中 无 需 通 过 “Options...” 定 义 误差 线 。 
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附 图 33 某 地 1952 年 与 1972 年 三 种 疾病 死亡 率 比较 
2.3.7 ” 圆 图 


根据 复方 猪 胆 于 治疗 老年 性 气管 炎 近 期 疗效 资料 ( 见 表 5-20) 绘 制 单纯 型 近期 疗效 的 圆 图 。 数 据 录入 如 
附 图 34 所 示 。 
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附 图 34 表 5-20( 单纯 型 ) 对 应 的 数据 集 
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图 的 绘制 可 通过 “Graphs” 一 “Legacy Dialogs” 一 “Pie...” 实现 。 在 弹出 的 “Pie Charts” 对 话 框 中 选择 
“Summaries for groups of cases”, 点 击 “Define”。 在 弹出 的 “Define Pie” 对 话 框 中 , 单 击 “Sum of variable”, 把 “ 构 
成 比 ” 选 人“Variable” 框 ,分 组 变量 “疗效 ” 选 人 “Define Slices by” 框 。 如 附 图 35 所 示 。 

点 击 “OK” 得 到 原始 的 圆 图 。 可 根据 需要 进行 修改 得 到 附 图 36。 
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附 图 35 ”Define Pie 对 话 框 附 图 36 ”复方 猪 胆囊 治疗 单纯 型 老年 气管 炎 近 期 疗效 


2.3.8 ”百分比 条 图 
根据 复方 猪 胆囊 治疗 老年 性 气管 炎 近 期 疗效 资料 ( 见 表 5-20 ) 绘 制 百分比 条 图 。 数 据 录 人 如 附 图 37 所 示 。 
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附 图 37 表 5-20 对 应 的 数据 集 


百分比 条 图 的 绘制 可 通过 “Graphs” 一 “Legacy Dialogs” — “Bar...” 实现 。 在 弹出 的 “Bar Charts” 对 话 框 中 
选择 “Stacked” 和 “Summaries for groups of cases”, 点 击 “Define”。 在 弹出 的 “Define Stacked Bar” 对 话 框 中 , 选 
择 “Other statistic (e.g. mean)”， 将 “构成 比 ” 选 入 “Variable” 框 中 ,把 分 组 变量 “疾病 类 型 " 选 入 “ ‘Category Axis” 
框 , 把 “疗效 " 选 人 “Define Stacks by 框 。 如 附 图 38 所 示 。 
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附 图 38 Define Stacked Bar 对 话 框 


点 击 “OK”, 选中 输出 的 百分比 条 图 , 双击 进入 编辑 状态 , 点 击 右 上 角 的 工具 按钮 “ 炉 (Transpose chart 
coordinate system )”, 可 得 到 原始 的 百分比 条 图 ,再 根据 需要 进行 修改 得 到 附 图 39。 
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附 图 39 ”复方 猪 胆 襄 治 疗 老年 性 气管 炎 近 期 疗效 比较 


2.4 tz 俭 验 


2.4.1 ”配对 i 检验 

根据 例 7-2 的 资料 介绍 配对 + 检验 。 

研究 男性 志愿 者 饮用 咖啡 前 后 运动 状态 下 的 心肌 血 流量 , 数据 录入 如 附 图 40 所 示 。 其 中 , 每 个 对 子 观 
测 到 的 数据 放 在 同一 行 。 本 例 , 每 个 志愿 者 饮用 咖啡 前 后 的 心肌 血 流量 观测 值 放 在 同一 行 , 共 12 行 。 
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附 图 40 例 7-2 对 应 的 数据 集 


配对 t 检 验 可 通过 “Analysis” 一 “Compare Means” 一 “Paired-Samples T Test..….” 实现 。 在 弹出 的 对 话 框 
左 侧 的 变量 列表 中 单 击 选 择 成 对 分 析 的 变量 “饮用 前 "和 “饮用 后 ”, 单 击 按钮 “只”, 将 变量 选 和 到 “Paired 
Variable(s ”变量 列 表 中 。 如 附 图 41 所 示 。 
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附 图 41 Paired-Samples T Test 对话 框 


如 需 输 出 饮用 前 后 差 值 的 总 体 均 数 的 95% 可 信和 区间, 可 以 在 附 图 41 所 示 的 对 话 框 中 , 单 击 “Options...”， 
设置 “Confidence Interval” 为 95%, 点 击 “Continue”。 最 后 单 击 “OK” 完成 。 输出 的 主要 结果 如 下 : 


Paired Samples Test 





Paired Differences 





95% Confidence Interval 


of the Difference 





Sig.(2-tailed ) 


t 


Std. Deviation | Std. Error Mean Upper 











结果 中 ,从 左 到 右 依次 给 出 了 “饮用 前 - 饮用 后 ” 差 值 的 均 数 (Mean)、 标 准 差 (Std. Deviation )、 均 数 的 标 
准 误 (Std. Error Mean )、 差 值 总 体 均 数 的 95% 可 信和 区间 (95% Confidence Interval of the Difference), 以 及 1 值 (t)、 
自由 度 (df)、 双 侧 P 了 值 (Sig. 2-tailed)。 本 例 : 1=3.740, P=0.003, 可 以 认为 饮用 咖啡 前 后 运动 者 的 心肌 血 流量 
存在 差异 。 

2.4.2 ”两 组 独立 样本 的 1 检验 
根据 例 7-3 的 资料 介绍 两 组 独立 样本 的 1 检验 。 


附录 2 SPSS 统计 软件 上 机 实习 


研究 低 氧 环境 和 正常 含 氧 环境 中 运动 者 的 心肌 血 流量 ,数据 录入 如 附 图 和 2 所 示 。 其 中 , 分 组 变量 为 一 
列 , 本 例 为 “分 组 "(1= 正 常 组 ,2= 低 氧 组 ); 观测 指标 “心肌 流量 "为 一 列 。 
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附 图 42 例 7-3 对 应 的 数据 集 


两 组 独立 样本 的 1 检验 可 通过 :“Analyze” 一 “Compare Means” — “Independent-Samples T Test. ..” 实现 。 
在 弹出 的 对 话 框 左 侧 的 变量 列表 中 单 击 选择 观测 指标 “心肌 流量 ”, 单 击 按钮 “外”, 将 变量 选 入 到 “Test 
Variable(s ”列表 中 。 选 中 分 组 变量 “分 组 ”, 单 击 按钮 “路”, 将 变量 选 和 人 到 “Grouping Variable” 框 中 。 单 击 
“Define Groups.…”, 在 弹出 的 对 话 框 中 , 录入 两 组 的 赋值 “1” 和 “2”"。 如 附 图 43 所 示 。 





Independent-Sanples T Test 




















附 图 43 Independent-Samples T Test 对话 框 


如 需 输出 两 均 数 差 的 95% 可 信 区 间 , 可 以 单 击 * ‘Options...”, 设置 “Confidence Interval” 为 95% , 点 击 
“Continue”。 最 后 单 击 “OK” 完成。 输出 的 主要 结果 如 下 : 










t-test for Equality of Means 









95% Confidence 
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for Equality of 




























Variances Difference 
| Sig. Mean Std. Error 
F Sig. df (2-tailed) | Difference | Difference Lower Upper 
-7.579 想 .000 -2.4944 .3291 | -3.1960 






Equal variances not assumed 





Equal variances assumed 1.027 327 
-7.332 | 10.684 .000 —2.4944 .3402 | -3.2460 
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结果 整体 上 分 为 两 部 分 ,方差 齐 性 检验 的 结果 “Levene’s Test for Equality of Variances” 和 和 两 组 独立 样 
本 1 检验 的 结果 “t-test for Equality of Means”"。 其 中 ,1 检验 的 结果 包括 了 方差 齐 性 假定 满足 “Equal variances 
assumed” 和 不 满足 “Equal variances not assumed” 两 种 情况 的 检验 结果 , 从 左 到 右 依 次 给 出 了 1 值 (7)、 自 由 度 
(df)、 双 侧 己 值 (Sig. 2-tailed), 均 数 差 (Mean Difference)、 均 数 差 的 标准 误 (Std. Error Difference)、 两 均 数 差 的 
95% 可 信 区 间 (95% Confidence Interval of the Difference )。 

在 看 结果 时 , 首先 要 看 方差 齐 性 检验 的 结果 , 即 两 样本 所 来 自 的 总 体 是 否 方差 相等 。 本 例 F= 1.027， 
已 =0.327>0.05, 尚 不 能 认为 两 样本 方差 不 齐 , 可 以 采用 方差 齐 性 假定 满足 的 1 检验 结果 ,对 应 于 “Equal variances 
assumed” 一 行 。 本 例 : :=-7.579, P<0.001, 可 以 认为 两 种 环境 中 运动 者 的 心肌 血 流量 不 同 。 

如 果 方 差 齐 性 检验 的 结果 中 P<a, 即 两 总 体 方差 不 齐 , 则 应 采用 7 检验 。SPSS 的 操作 过 程 与 上 述 两 组 
独立 样本 的 :检验 相同 , 只 是 在 选择 /检验 的 结果 时 , 需 选择 方差 齐 性 假定 不 满足 , 即 “Equal variances not 
assumed” 所 对 应 的 那 一 行 的 结果 即 可 。 

2.4.3” 正 态 性 检验 

Student 1 检验 有 两 个 应 用 前 提 : 样本 所 来 自 的 总 体 服从 正 态 分 布 ( 即 正 态 性 ), 以 及 两 独立 样本 比较 时 ， 
要 求 其 所 来 自 的 两 总 体 方差 相等 ( 即 方差 齐 性 )。 注 意 到 ,方差 齐 性 的 结果 在 进行 两 独立 样本 /检验 的 SPSS 
结果 中 会 自动 给 出 。 本 节 我 们 介绍 一 下 如 何 对 资料 进行 正 态 性 检验 , 仍然 结合 例 7-3 的 资料 介绍 。 

正 态 性 检验 可 通过 “Analyze” 一 “Descriptive Statistics” 一 “Explore.. .” 实 现 。 在 弹出 的 对 话 框 左 侧 的 变量 
列表 中 , 选中 观测 指标 “心肌 流量 ”, 单 击 按钮 “和 超 ” ,将 变量 选 入 到 “Dependent List" 列表 框 中 ; 将 分 组 变量 
“分 组 ”, 选 入 到 “Factor List” 框 中 。 如 附 图 44 所 示 。 
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附 图 44 ”Explor 对 话 框 


单 击 “Plots...”, 在 弹出 的 对 话 框 中 , 选中 “Normality plots with tests”, 点 击 “Continue”。 最 后 单 击 “OK” 完 


成 。 输 出 的 主要 检验 结果 如 下 : 
Shapiro-Wilk 
Statistic df Sig. 
“ .872 .130 
.781 


正 态 性 检验 采用 了 两 种 方法 : Kolmogorov-Smirnov 法 和 Shapiro-Wilk 法 ,分 别 给 出 了 两 组 的 统计 量 值 
(Statistic)、 自 由 度 (df) 和 已 值 (Sig. )。 其 中 ,Shapiro-Wilk 法 主要 适用 于 样本 含量 少 于 100 的 资料 。 本 例 , 选 
择 Shapiro-Wilk 法 的 结果 , 正常 组 : P=0.130; 低 氧 组 : P=0.781, 两 组 的 了 值 均 大 于 0.10, 说 明 两 组 资料 满足 
正 态 性 假定 , 可 采用 Student 1 检验 。 
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附录 2 SPSS 统计 软件 上 机 实习 


2.5 方差 分 析 
2.5.1 ”完全 随机 设计 的 方差 分 析 
根据 例 8-1 的 资料 介绍 完全 随机 设计 的 方差 分 析 。 
研究 药物 不 同 剂量 的 部 分 凝血 活 酶 时 间 , 数据 录入 如 附 图 45 所 示 。 其 中 , 分 组 变量 为 一 列 , 本 例 为 “ 注 
射 剂量 ”(1=“0.5U”、2=“1U”、3=“2U” ); 观测 指标 “部 分 凝血 活 酶 时 间 ” 为 一 列 。 
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附 图 45 例 8-1 的 数据 集 


多 个 独立 样本 均 数 比较 的 方差 分 析 可 通过 “Analyze" 一 “Compare Means” 一 “One-Way Anova..… 实现。 在 
弹出 的 对 话 框 左 侧 的 变量 列表 中 单 击 选择 “部 分 凝血 活 酶 时 间 ”, 单 击 按钮 “中 ”, 将 变量 选 和 到 “Dependent 
List 中 ; 单 击 选择 分 组 变量 “注射 剂量 ”, 单 击 按钮 四”, 将 变量 选 人 到 “Factor List” 中 。 如 附 图 46 所 示 。 























附 图 46 One-Way ANOVA 对 话 框 


对 于 方差 分 析 , 可 直接 在 附 图 46 的 界面 上 进行 多 重 比 较 和 方差 齐 性 检验 的 定义 , SPSS 将 同时 给 出 两 者 
的 结果 。 

均 数 间 多 重 比 较 的 实现 : 单 击 “Post Hoc...”, 在 弹出 对 话 框 中 选择 多 重 比较 的 方法 ,再 点 击 “Continue” 返 
回 主 界面 。SPSS 提供 了 很 多 常用 的 多 重 比较 方法 ,包括 : LSD、Bonferroni、 Sidak、SNK、Tukey、Dunnett 等 ， 供 
用 户 根 据 人 研究 需要 进行 选择 。 本 例 , 选择 SNK 法 。 

方差 齐 性 检验 的 实现 : 单 击 “Options...”, 在 弹出 的 对 话 框 中 选择 “Homogeneity of variance test”, 然后 单 
击 “Continue” 返回 主 界面 。 

最 后 , 单 击 “OK” 完成 。 输 出 的 主要 结果 如 下 : 





附录 2 SPSS 统计 软件 上 机 实习 














(1) 方 差 齐 性 检验 的 结果 
Test of Homogeneity of Variances 
部 分 凝血 活 酶 时 间 
Levene Statistic dfl df2 Sig. 
1.847 | 2| 27 | .177 
〈2) 方差 分析 的 结果 
ANOVA 


部 分 凝血 活 酶 时 间 
















| | Moe | F | Se | 
Between Groups 91.225 2 45.612 6.524 .005 
Within Groups 188.757 27 6.991 

Total 279.982 29 





(3) SNK 检验 的 结果 
部 分 凝血 活 酶 时 间 


Student-Newman-Keuls” 











Means for groups in homogeneous subsets are displayed. 


a. Uses Harmonic Mean Sample Size = 10.000. 


结果 1 为 进行 多 个 独立 样本 方差 齐 性 检验 的 Levene 检验 结果 ， 依次 输出 检验 统计 量 (Levene Statistic ) 和 
尸 值 (Sig.)。 本 例 Levene Statistic=1.847, P=0.177, 表示 各 组 48 小 时 部 分 凝血 活 栈 时间 的 观测 值 满 足 方差 
齐 性 。 

结果 2 为 方差 分 析 的 结果 , 列 出 了 方差 分 析 表 , 从 第 一 列 其 依次 为 变异 来 源 、 离 均 差 平方 和 (Sum of 
Squares)、 自 由 度 (df)、 均 方 (Mean Square) 下 值 (F) 和 书 值 (Sig.)。 其 中 , 变异 来 源 中 , 包括 :组 间 (Between 
Groups)、 组 内 (误差 )( Within Groups ) 和 总 的 (Total)。 本 例 =6.524, P=0.005, 可 以 认为 三 种 不 同 剂量 48 小 
时 部 分 凝血 活 酶 时 间 不 全 相同 。 

结果 3 为 SNK 检验 的 结果 , 依次 给 出 了 比较 的 组 别 (已 按照 均 数 由 小 到 大 排 好 序 入 样本 量 (N)、 在 0.05 
水 准 下 的 检验 结果 (Subset for alpha = 0.05), 其 中 , 位 于 相同 子 集中 的 均 数 差异 无 统计 学 意义 , 位 于 不 同 子 集 
中 的 均 数 差异 有 统计 学 意义 。 本 例 , 剂量 1(0.5U) 和 剂量 3(2U ) 的 均 数 均 在 子 集 1 中 ,差异 无 统计 学 意义 ， 
而 只 有 剂量 2(1U ) 的 均 数 在 子 集 2 中 , 说明 其 与 剂量 1 和 剂量 3 差异 均 有 统计 学 意义 。 因 此 , 尚 不 能 认为 剂 
量 1 和 剂量 3 的 48 小 时 部 分 凝血 活 酶 时 间 不 同 , 可 认为 剂量 2 与 另外 两 个 剂量 的 48 小 时 部 分 凝血 活 酶 时 间 
均 不 同 ,剂量 2 的 最 长 。 
2.5.2 ”随机 区 组 设计 的 方差 分 析 

根据 例 8-2 的 资料 介绍 随机 区 组 设计 的 方差 分 析 。 

研究 三 种 不 同 处 理 的 大 鼠 MT 含量 , 数据 录入 如 附 图 47 所 示 。 其 中 , 分 组 变量 为 一 列 , 本 例 为 “处 理 ” 
(1=“ 对 照 组 ”、2="“ 握 化 饥 组 "、3=“Rgl+ 氧化 饥 组 ” ); 区 组 变量 为 一 列 , 本 例 为 “ 窝 别 ”; 观测 指标 为 一 列 , 本 
例 为 “MT 含量 值 ”。 

随机 区 组 设计 的 方差 分 析 可 通过 “Analyze” — “General Linear Model” 一 “Univariate...” 实 现 。 在 弹出 的 
对 话 框 中 ， 将 左 侧 的 变量 列表 中 “MT 含量 值 ” 选 入 到 “Dependent Variable” 中 ; 将 变量 “处理 ”和 “ 窝 别 " 选 和 人 
到 “Fixed Factor(s 中 。 如 附 图 48 所 示 。 
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附 图 48 Univariate 对 话 框 
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附 图 47 例 8-2 的 数据 集 


单 击 “Model...”, 在 弹出 对 话 框 中 的 “Specify Model” 下 选择 “Custom”; “Build Term(s) 中 的 “Type: ”下 选 
择 “Main effects”, 然后 将 左 侧 “Factors & Covariates” 中 “处 理 ”" 和 “ 窝 别 ” 选 信 “Model” 中 ; 在 “Sum of squares” 
下 选择 “Type 亚 ”, 将 “Include intercept in Model" 选中 。 然 后 单 击 “Continue”。 如 附 图 49 所 示 。 
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附 图 49 Univariate: Model 对话 框 


点 击 “Post Hoc...”, 在 “Factor(s ”选择 分 组 变量 “处 理 ”, 单 击 按钮 “外”, 将 变量 选 入 到 “Post Hoc Tests 
for:” 中 ; 在 “Equal Variances Assumed" 框 中 , 选择 多 重 比 较 的 方法 。 本 例 , 选择 “SNK” 法 。 然 后 单 击 “Continue 。 

最 后 单 击 “OK” 完成 。 输 出 的 主要 结果 如 下 : 

(1) 方 差分 析 的 结果 


Tests of Between-Subjects Effects 
Dependent Variable: MT 含量 值 


Source 


Corrected Model 





Type WM Sum of Squares 
34355.761* 
222551.307 


Mean Square 
3123.251 
222 551.307 


64.567 


Intercept 4600.797 





处 理 
窝 别 


33 078.798 
1276.963 
870.702 
257777.770 
35 226.463 


Error 


Total 


Corrected Total 





16539.399 
141.885 
48.372 








341.919 
2.933 











a. R Squared = .975( Adjusted R Squared = .960) 
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(2) SNK 法 的 结果 
MT 含量 值 


Student-Newman-Keuls“… 





Subset 








127.110 
1.000 





Means for groups in homogeneous subsets are displayed. 
Based on observed means. 

The error term is Mean Square(Error)= 48.372. 

a. Uses Harmonic Mean Sample Size = 10.000. 

b. Alpha = 0.05. 


结果 (1) 是 随机 区 组 设计 方差 分 析 的 结果 , 表 中 依次 给 出 了 变异 来 源 (Source) 看 型 离 均 差 平方 和 (Type 

亚 Sum of Squares)、 自由 度 (df)、 均 方 (Mean Square)、F 值 (F) 和 P 值 (Sig.)。 其 中 , 变异 来 源 包括 : 校正 模型 
(Corrected Model)、 常 数 项 (Intercept)、 治 疗 组 、 区 组 、 误 差 (Error )、 总 变异 (Total)、 校 正 的 总 变异 ( Corrected 
Total)。 本 例 ,处理 对 应 的 =341.919, P<0.001, 可 认为 三 种 治疗 方法 缓解 胃痛 时 间 的 总 体 均值 不 全 相同 。 

结果 (2) 是 针对 “处 理 ” 的 SNK 检验 结果 。 本 例 , 三 种 处 理 大 鼠 MT 含量 的 总 体 均值 两 两 均 不 相同 。 
2.5.3” 析 因 设 计 的 方差 分 析 

根据 例 8-5 的 资料 介绍 析 因 设计 的 方差 分 析 。 

研究 四 种 不 同 处 理 的 BALF 中 IL-4 水 平 ,数据 录入 如 附 图 50 所 示 。 其 中 , 两 个 因素 各 为 一 列 , 1 、2 分 别 
表示 不 同 的 水 平 ; 观测 指标 为 一 列 , 本 例 为 “IL_4 值 ”。 
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附 图 50 例 8-5 的 数据 集 


析 因 设计 的 方差 分 析 过 程 与 节 2.5.2 介绍 的 随机 区 组 方差 分 析 的 SPSS 操作 过 程 相似 。 均 通过 “Analyze” 一 
“Ceneral Linear Model” 一 “Univariate...” 实现 。 首 先 , 在 Univariate 对 话 框 中 ,将 左 侧 的 变量 列表 中 “IL_4 值 ” 
选 入 到 “Dependent Variable” 中 ;将 变量 “A 因素 ”和 “B 因素 ” 选 入 到 “Fixed Factor(s》 中 。 点 击 “Model...”， 
在 弹出 的 对 话 框 中 的 “Specify Model" 下 选择 默认 项 “Full factorial” , 并 单 击 “Continue 。 最 后 单 击 “OK” 完成 。 
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输出 的 主要 结果 如 下 : 





Tests of Between-Subjects Effects 
Dependent Variable: IL_4 值 


Type 亚 Sum of Squares df Mean Square 


Corrected Model 1512.560” 504.187 33.450 





Intercept 61253.320 61253.320 4063.855 
A 因 索 250.650 250.650 16.629 
B 因素 836.219 836.219 55.479 


A 因素 * B 因素 425.691 425.691 28.242 
Error 542.618 15.073 
Total 63 308.498 
Corrected Total 2055.178 
a. R Squared = .736( Adjusted R Squared = .714) 














上 表 为 本 例 的 方差 分 析 表 , 表 中 各 列 的 意义 同 节 2.5.2 介绍 的 随机 区 组 方差 分 析 表 , 此 处 不 再 著述 。 
本 例 ,“A 因素 "对 应 的 下 =16.629, P<0.001, 可 认为 4, 组 与 4 组 IL-4 值 总 体 均 数 不 相 等 ;"B 因素 ”对 应 的 
下 =55.479, 忆 <0.001, 可 认为 B1 组 与 B, 组 1L-4 值 总 体 均 数 不 相 等 ;“A 因素 *B 因素 "表示 AB 的 交互 作用 ， 
其 =28.242, P<0.001, 说明 A 与 B 两 处 理 因 素 之 间 存 在 交互 作用 。 

2.5.4 ”重复 测量 设计 的 方差 分 析 

根据 例 8-6 的 资料 介绍 重复 测量 设计 的 方差 分 析 。 

研究 三 种 麻醉 诱导 在 五 个 时 相 的 收缩 压 变化 , 数据 录入 如 附 图 51 所 示 。 其 中 , 处 理 因素 为 一 列 ,本 例 
为 “诱导 方法 ”, 1 =“A”、2=“B”、3=“C”; 不 同时 间 点 的 观测 值 各 为 一 列 , 本 例 为 不 同 诱导 时 相 的 患者 收缩 压 
测量 值 , 从 To-T4。 
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附 图 51 例 8-6 的 数据 集 


重复 测量 设计 的 方差 分 析 可 通过 “Analysis” 一 “General Linear Model" 一 “Repeated Measusres.…” 实现 。 

在 弹出 的 “Repeated Measures Define Factor(s) 对 话 框 中 ， “Within-Subject Factor Name” 文本 框 中 填 人 名 
称 “诱导 时 相 ”; 在 “Number of Levels" 文 本 框 中 填 入 数字 “5”, 表示 有 5 个 时 间 点 的 数据 ; 单 击 “Add” 按钮 ， 在 
Add 按钮 右 侧 变量 列表 会 出 现 “ 时 点 (5》”, 点 击 “Define" 按钮 。 

在 弹出 的 “Repeated Measures” 对 话 框 中 , 在 左 侧 的 变量 列表 中 单 击 选择 分 析 变量 “T0”, 单 击 按钮 “外”， 
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将 变量 “T0” 选 入 到 “Within-Subjects Variables( 诱 导 时 相 ):” 变量 列表 中 。 对 变量 “T1”、“T2”、“T3”、“T4” 也 
进行 类 似 变 量 “T0” 的 操作 。 将 分 组 变量 “诱导 方法 ” 选 信 “Between-Subjects Factors(s):” 列 表 框 中 。 如 附 图 
52 所 示 。 
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附 图 52 ”Repeated Measures 对 话 框 


单 击 “OK” 完 成。 输出 的 主要 结果 如 下 : 
(1) 受 试 对 象 内 的 方差 分 析 表 


Tests of Within-Subjects Effects 
Measure: MEASURE_1 

































































Type I Sum of Squares df Mean Square F 
Sphericity Assumed 2336.453 4 584.113 106.558 
Greenhouse-Geisser 2336.453 2.715 860.644 106.558 
Huynh-Feldt 2336.453 4.000 584.113 106.558 
Lower-bound 2336.453 1.000 2336.453 106.558 
诱导 时 相 * 诱 导 方法 。 Sphericity Assumed 837.627 8 104.703 19.101 
Greenhouse-Geisser 837.627 5.430 154.272 19.101 
Huynh-Feldt 837.627 8.000 104.703 19.101 
Lower-bound 837.627 2.000 418.813 19.101 
Error( 诱 导 时 相 ) Sphericity Assumed 263.120 48 5.482 
Greenhouse-Geisser 263.120 32.577 8.077 
Huynh-Feldt 263.120 48.000 5.482 
Lower-bound 263.120 12.000 21.927 


















(2) 受 试 对 象 间 的 方差 分 析 表 


Tests of Between-Subjects Effects 
Measure: MEASURE_1 
Transformed Variable: Average 


















Mean Square F 
1155433.080 14649.223 

456.120 5.783 
78.873 


Type WW Sum of Squares 
1155 433.080 
912.240 
946.480 


Source 












Intercept 
诱导 方法 


Error 












结果 (1) 为 受 试 对 象 内 的 分 析 结 果 , 其 方差 分 析 表 报告 的 各 列 指标 同 节 2.5.2 介绍 的 随机 区 组 方差 
分 析 表 , 此 处 不 再 袭 述 。 本 例 , 无 论 是 否 满足 球 对 称 假定 , 其 检验 下 值 与 己 值 (包括 Sphericity Assumed、 


附录 2 SPSS 统计 软件 上 机 实习 


Greenhouse-Geisser、Huynh-Feldt、Lower-bound ) 相 同 , “麻醉 诱导 时 相 ” 对 应 的 =106.558, P<0.001, 说 
明 不 同时 间 点 之 间 的 差异 有 统计 学 意义 ; “诱导 时 相 * 诱导 方法 ”表示 时 间 与 处 理 的 交互 作用 , 其 对 应 的 
= 19.101, P<0.001, 说 明 时 间 与 处 理 的 交互 作用 有 统计 学 意义 。 

结果 (2 ) 为 受 试 对 象 间 的 分 析 结 果 。 本 例 , “诱导 方法 ”对 应 的 F=5.783, P=0.017, 可 认为 不 同 诱导 方法 
之 间 的 差异 有 统计 学 意义 。 
2.6 多 伶 验 
2.6.1 四 格 表 资 料 的 克 检 验 

根据 例 9-1 的 资料 介绍 四 格 表 资 料 的 妃 检 验 。 

研究 吗 达 帕 胺 片 治疗 原 发 性 高 血压 , 数据 录入 如 附 图 53 所 示 。 其 中 , “组 别 " 为 分 组 变量 ,“ 治 疗 结果 ” 
为 观测 指标 ，f 为 四 格 表 资料 中 四 个 格子 的 频数 , 即 不 同 组 别 下 某 个 治疗 结果 出 现 的 频数 。 
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附 图 53 表 9-1 对 应 的 数据 集 


注意 到 , 四 格 表 资 料 是 已 经 经 过 整理 的 数据 , 而 统计 软件 通常 是 根据 原始 数据 进行 分 析 的 。 因 此 , 在 做 
检验 前 ,首先 需要 用 “f' 对 数据 集 进行 加 权 。 数 据 加 权 的 过 程 同 本 章 2.3.1, 此 处 不 再 袭 述 。 

四 格 表 资 料 的 ?检验 可 通过 “Analyze” 一 “Descriptive Statistics” — “Crosstabs...” 实现 。 在 弹出 的 对 话 术 
左 侧 的 变量 列表 中 选中 行 变 量 “ 组 别 ", 单 击 按钮 “办”, 将 变量 选 入 到 “Row(s》 列表 框 中 ， 将 列 变量 “治疗 结 
果 " 选 人 “Column(s) 列表 框 中 。 如 附 图 54 所 示 。 
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点 击 “Statistics”, 选择 “Chi-square”; 点 击 “Continue”。 点 击 “Cell”, 可 以 根据 结果 显示 的 需要 , 选择 
“Observed”( 显示 四 个 格子 的 实际 频数 )“Expected”( 计 算 四 个 格子 的 理论 频数 ),“Row”( 显 示 行 百分比 ) 和 
“Column"( 显 示 列 百分比 ) 及 “Total”( 显示 合计 的 行 和 列 百分比 ), 点 击 “Continue”。 

最 后 , 单 击 “OK” 完 成。 输出 的 主要 结果 如 下 : 


Chi-Square Tests 
| Asymp. Sig.(2-sided ) | Exact Sig.( 2-sided ) | Exact Sig.( 1-sided ) 











Pearson Chi-Square 
Continuity Correctiony 


Likelihood Ratio 
Fisher’s Exact Test 
N of Valid Cases 


a. 0 cells( .0% )have expected count less than 5. The minimum expected count is 10.77. 


b. Computed only for a 2x2 table 


结果 中 分 别 给 出 了 Pearson 卡 方 (Pearson Chi-Square)， 连续 性 校正 的 卡 方 (Continuity Correction ), 对 数 
似 然 比 方法 计算 的 卡 方 (Likelihood Ratio), Fisher’s 精确 概率 法 (Fisher’s Exact Test ), 有 效 记 录 数 (N of Valid 
Cases ) 等 。 

每 种 方法 对 应 的 结果 包括 : 统计 量 (Value)、 自由 度 (df)、 双 侧 近 似 了 值 (Asymp. Sig.(2-sided ))、 双 侧 确切 
已 值 (Exact Sig.(2-sided)) 和 单 侧 确切 已 值 (Exact Sig.( 1-sided ))。 

并 且 , 在 表 的 下 方 通过 备注 的 方式 给 出 了 是 否 满足 多 检验 的 条 件 , 本 例 , “备注 a 显示 :“0 cells( .0%) 
have expected count less than 5. The minimum expected count is 10.77.” 即 没有 格子 的 理论 频数 小 于 5, 最 小 的 理 
论 频数 为 10.77。 因 此 , 可 采用 Pearson 卡 方 检验 的 结果 ,x?=8.399, P=0.004, 可 以 认为 两 组 治疗 原 发 性 高 血 
压 的 总 体 有 效率 不 等 , 即 可 认为 吗 达 帕 胺 片 治疗 原 发 性 高 血压 是 有 效 的 。 

对 于 需要 采用 连续 性 校正 的 卡 方 检验 , 或 者 Fisher 精确 概率 法 计算 时 , SPSS 的 操作 过 程 相同 , 注意 到 ， 
在 输出 的 结果 中 , 其 实 已 经 同时 给 出 了 上 述 两 种 方法 的 结果 , 大 家 只 需要 根据 结果 下 方 “备注 a" 的 提示 ,来 
判断 应 该 选择 何 种 方法 的 输出 结果 即 可 。 

2.6.2 ”配对 四 格 表 资料 的 态 检 验 

根据 例 9-4 的 资料 介绍 配对 四 格 表 资 料 的 ?检验 。 

研究 两 种 培养 基 的 阳性 培养 率 , 数据 录入 如 附 图 55 所 示 。 其 中 ,“A 培养 基 "、“B 培养 基 ” 变量 表示 两 种 
培养 基 的 培养 结果 , “频数 " 变量 表示 两 种 培养 基 培 养 结果 不 同 组 合 下 的 频数 。 
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附 图 55 表 9-5 对 应 的 数据 集 











配对 四 格 表 资 料 的 必 检 验 操作 过 程 与 节 2.6.1 中 的 四 格 表 必 检验 相同 ,要 先进 行 数据 加 权 ( 本 例 中 权重 
变量 为 频数”), 再 进行 六 检验 。 唯 一 不 同 的 是 点 击 “Statistics” 后 ， 选择 “McNemar”。 
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输出 的 主要 结果 如 下 : 
Chi-Square Tests 
| 
McNemar Test 2 
N of Valid Cases 198 





a. Binomial distribution used. 


SPSS 软件 的 “Crasstabs” 功能 不 输出 McNemar 检验 的 统计 量 值 , 仅 输出 卫 值 [ Exact Sig.(2-sided )]。 本 
例 ,P=0.652, 尚 不 能 认为 两 种 培养 基 的 阳性 率 不 同 。 
2.6.3” 行 x 列表 资料 六 检验 

根据 例 9-5 的 资料 介绍 行 x 列表 资料 的 x? 检 验 。 

研究 三 种 方案 治疗 急性 肝炎 的 有 效率 ,数据 录入 如 附 图 56 所 示 。 
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附 图 56 ” 表 9-6 对 应 的 数据 集 
行 x 列表 资料 的 儿 检验 操作 过 程 与 节 2.6.1 中 的 四 格 表 必 检验 相同 ,要 先进 行 数据 加 权 , 本 例 权 重 变 量 
输出 的 主要 结果 如 下 : 
Chi-Square Tests 





Asymp. Sig.(2-sided ) 


Pearson Chi-Square 
Likelihood Ratio 
N of Valid Cases 


a. 0 cells( .0% )have expected count less than 5. The minimum expected count is 31.76. 











结果 中 分 别 给 出 了 Pearson 卡 方 (Pearson Chi-Square ), 对 数 似 然 比方 法 计算 的 卡 方 (Likelihood Ratio ) 
和 有 效 记 录 数 (N of Valid Cases)。 每 种 方法 对 应 的 结果 包括 : 统计 量 (Value)、 自由 度 (df)、 双 侧 近 似 什 
(Asymp. Sig.(2-sided ) )。 

本 例 好 =22.808, P<0.001, 可 认为 三 种 疗法 的 有 效率 不 全 相等 。 

需 进 一 步 进 行 两 两 比较 时 , 可 在 校正 检验 水 准 a 的 基础 上 ,分别 对 欲 比 较 的 两 个 组 进行 四 格 表 检验 
(操作 过 程 见 节 2.6.1)。 校 正 wx 的 原则 与 方法 详 见 本 书 第 9 章 。 


2.7 “” 非 参 数 检 验 


2.7.1 配对 资料 的 符号 秩 和 检验 
根据 例 10-1 的 资料 介绍 配对 资料 的 符号 秩 和 检验 。 
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研究 白癜风 病人 的 IL-6 指标 在 白斑 部 位 与 正常 部 位 有 无 差异 , 数据 录入 如 附 图 57 所 示 。 一 名 病人 的 两 
个 部 位 的 IL6 指标 放 在 同一 行 。 
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Wilcoxon 符号 秩 和 检验 可 通过 “Analyze” 一 “Nonparametric Test” 一 “2 Related Samples.….” 实现 。 在 弹出 
的 对 话 框 左 侧 的 变量 列表 中 选中 分 析 变 量 , 单 击 按钮 “ 哆 ”, 将 变量 “正常 部 位 ”和 “白斑 部 位 ” 选 入 到 “Test 
Pairs” 变量 列表 中 的 “Variablel” 和 “Variable2” 中 , 并 在 “Test Type” 中 选择 “Wilcoxon”, 如 附 图 58 所 示 。 
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附 图 58 Two-Related-Samples Tests 对 话 框 


单 击 “OK" 完成 。 主 要 输出 结果 如 下 : 


Test Statistics" 


| | 自 王 部 位 -正常 部 位 


Zz —2.240" 
Asymp. Sig.( 2-tailed ) .025 


a. Based on positive ranks. 


b. Wilcoxon Signed Ranks Test 









Wilcoxon 符号 秩 检验 的 主要 检验 结果 包括 : 统计 量 (Z) 和 P 值 (Asymp. Sig.(2-tailed))。 本 例 ,Z=-2.240， 
已 =0.025, 可 认为 白斑 部 位 与 正常 部 位 的 白介素 有 差异 。 
2.7.2 ”两 样本 比较 的 秩 和 检验 

根据 例 10-3 的 资料 介绍 两 样本 比较 的 秩 和 检验 。 

研究 有 无 淋巴 细胞 转移 的 胃癌 患者 对 生存 时 间 的 影响 , 数据 录入 如 附 图 59 所 示 。 其 中 “组 别 " 为 分 组 
变量 , 1= 无 淋巴 细胞 转移 ,2= 有 淋巴 细胞 转移 。 
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附 图 59 表 10-4 对 应 的 数据 集 


两 样本 比较 的 Wilcoxon 秩 和 检验 可 通过 “Analyze” — “Nonparametric Test” — “2 Independent Samples.. 天 
实现 。 在 弹出 的 对 话 框 左 侧 的 变量 列表 中 选中 分 析 变 量 “生存 时 间 ”, 单 击 按钮 “路”, 将 变量 选 入 到 “Test 
Variable List” 列表 框 中 , 将 变量 “组 别 " 选 人 到 “Grouping Variable” 变量 列表 中 。 并 点 击 “Define Groups.…. g 
在 弹出 的 对 话 框 中 , 分 别 在 “Group 1” 选 框 中 输入 1, 在 “Group 2” 选 框 中 输入 2, 单 击 “Continue”。 在 “Test 
Type” 中 , 选择 “Mann-Whitney U”。 如 附 图 60 所 示 。 
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附 图 60 Two-Independent-Samples Tests 对 话 框 


单 击 “OK” 完成 。 输 出 的 主要 结果 如 下 : 


Test Statistics® 









Mann-Whitney U 
Wilcoxon W 
Zz 
Asymp. Sig.(2-tailed ) 
Exact Sig. [ 2*( 1-tailed Sig. ) ] 
a. Not corrected for ties. 

b. Grouping Variable: 组 别 
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两 组 Wilcoxon 符号 秩 和 检验 的 主要 结果 包括 Mann-Whitney U 统计 量 (Mann-Whitney U), Wilcoxon 球 统 
计量 (Wilcoxon W),Z 检验 统 计量 (Z), 近似 双 侧 P 值 (Asymp. Sig.(2-tailed ) ) 和 确切 的 已 值 | Exact Sig. [ 2* 
(1-tailed Sig.)]}。 本 例 ,Z=-2.172, P=0.030, 可 认为 两 组 患者 的 平均 生存 时 间 不 同 。 

对 于 等 级 资料 的 比较 , 所 收集 的 资料 如 为 频数 表 ( 见 例 10-4), 则 需 先 根据 频数 对 数据 进行 加 权 , 再 采用 
上 述 过 程 操作 即 可 。 需 要 注意 的 是 , 分 组 变量 的 赋值 必须 是 数值 型 。 

2.7.3 ”多 个 样本 比较 的 秩 和 检验 

根据 例 10-5 的 资料 介绍 多 个 样本 比较 的 秩 和 检验 。 

研究 霍乱 菌 苗 不 同 途径 的 免疫 效果 , 数据 录入 如 附 图 61 所 示 。 其 中 “ 滴 度 "为 血清 抗体 滴 度 水 平 的 编 
秩 , 滴 度 “1:10” 至 “1:320” 依 次 编 为 “1” 至 “6”;“f' 为 各 个 滴 度 出 现 的 频数 ;“ 组 别 ” 为 分 组 变量 , 1= 气 雾 组 
80 亿 /ml,2= 气 雾 组 100 亿 /ml,3= 皮 下 注射 组 。 
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附 图 61 表 10-6 对 应 的 数据 集 


本 例 为 频数 表 资料 , 需 先 根据 频数 “f' 对 数据 进行 加 权 , 方法 参见 节 2.6.1。 

多 个 样本 比较 的 Krmuskal-Wallis HW 检验 可 通过 “Analyze” 一 “Nonparametric Test 一 “和 Independent Samples...” 
实现 。 在 弹出 的 对 话 框 左 侧 的 变量 列表 中 选中 分 析 变 量 “ 滴 度 ”, 单 击 按钮 “只 ”, 将 变量 选 人 到 “Test Variable 
List” 列表 中 , 将 分 组 变量 “组 别 " 选 人 到 “Grouping Variable” 变量 列表 中 。 再 点 击 “Define Range...”( 分 组 变 
量 的 赋值 范围 , 本 例 为 1 到 3), 在 弹出 的 对 话 框 中 , 在 “Minimum”" 选 框 中 输入 “1”, 在 “Maximum” 选 框 中 输入 
“3”, 单 击 “Continue”。 在 “Test Type” 中 ,选择 “Kruskal-Wallis H”。 如 附 图 62 所 示 。 
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附 图 62 Test for Several Independent Samples 对 话 框 





单 击 “OK” 完成 。 输 出 的 主要 结果 如 下 : 
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Test Statistics™* 





a. Kruskal Wallis Test 
b. Grouping Variable: 组 别 
多 个 样本 比较 的 Kruskal-Wallis 万 检验 的 主要 结果 包括 统计 量 ( Chi-Square), 自由 度 (df) 和 卫 值 ( Asymp. 
Sig.)。 本 例 , 妇 =12.267, P=0.002, 可 认为 三 组 血清 抗体 滴 度 水 平 不 全 相等 。 


2.8 线性 回归 与 相关 
2.8.1 ”线性 回归 
根据 例 11-1 的 资料 介绍 线性 回归 分 析 。 


研究 饮水 氢 含 量 与 成 人 肯 X 线 改变 指数 的 关系 ,数据 录入 如 附 图 63 所 示 。 其 中 ,“Y” 为 应 变量 “成 人 骨 
X 线 改变 指数 "; “X” 为 自 变 量 “饮水 气 含 量 "。 
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两 变量 直线 回归 分 析 可 通过 “Analyze” 一 “Regression” 一 “Linear...” 实现 。 在 弹出 的 对 话 框 左 侧 的 变量 
列表 中 选中 应 变量 “Y”, 单 击 按钮 “加”, 将 应 变量 选 和 “Dependent”; 选中 自 变 量 “X”, 单 击 按钮 “只”, 将 自 
变量 选 入 “Independent(s)” 列 表 中 。 如 附 图 64 所 示 。 
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附 图 64 Linear Regression 对 话 框 
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单 击 “Statistics...”, 在 弹出 的 对 话 框 中 “Regression Coefficient” 下 选择 “Estimates” 和 “Confidence intervals” 
分 别 输出 回归 系数 的 相关 估计 量 及 其 95% 可 信 区 间 ; 选择 “Model fit”, 输出 拟 合 优 度 检 验 的 相关 信息 。 其 
中 ,“Estimates” 和 “Model fit” 为 默认 选项 。 然 后 单 击 “Continue”。 

单 击 “Save...”, 在 弹出 的 对 话 框 中 “Prediction Intervals” 下 选择 “Mean” 和 “Individual” 可 分 别 输 出 条 件 均 
数 的 95% 可 信 区 间 和 个 体 值 的 容许 区 间 。 然 后 单 击 “Continue”。 

单 击 “OK” 完 成。 输出 的 主要 结果 如 下 : 

(1) 模型 的 拟 合 优 度 情况 











Model Summary? 


[voaa | rR | R Square Adjusted R Square | Std. Error of the Estimate 


a. Predictors:( Constant), 饮水 气 含量 
b. Dependent Variable: 骨 X 线 改变 指数 
















































〈2) 模型 的 方差 分 析 表 
ANOVA" 
Sum of Squares df Mean Square F Sig. 
Regression 12537.411 1 12537.411 43.324 .000* 
Residual 2025.728 yh 289.390 
Total 14 563.139 8 
a. Predictors:( Constant ), 饮水 氛 含 量 
b. Dependent Variable: 骨 X 线 改变 指数 
(3) 回归 系数 的 估计 及 其 检验 
Coefficients” 
| Unstandardized Standardized 
Cathdieas 人 95.0% Confidence Interval for B 
Model | B | si.Eror Beta t Sig. | LowerBound | UpperBound 








1 (Constant) -13.079 


8.500 —1.539 | .168 -33.178 7.020 
饮水 扬 含 量 9.939 1.510 .928 | 6.582| .000 6.368 13.510 


a. Dependent Variable: 骨 X 线 改变 指数 























结果 (1) 为 所 拟 合 模型 的 拟 合 优 度 情况 ,包括 相关 系数 (R)、 决 定 系数 (R Square)、 校 正 的 决定 系数 
(Adjusted R Square)、 估 计 的 标准 误 (Std. Error of the Estimate )。 本 例 , 相关 系数 为 0.928, 决定 系数 为 0.861， 
校正 决定 系数 为 0.841。 

结果 (2 ) 为 模型 的 方差 分 析 表 , 包括 变异 来 源 (Model)、 离 均 差 平方 和 (Sum of Squares) 自由 度 (df)、 均 方 
(Mean Square)、F 值 (F) 和 P 值 (Sig.)。 本 例 ,F=43.324, P<0.001, 表明 所 建立 的 模型 有 统计 学 意义 。 

结果 (3) 为 回归 系数 的 估计 及 其 检验 ,包括 模型 系数 的 (Model)、 回归 系数 估计 (Unstandardized Coefficients )、 
标准 化 回归 系数 (Standardized Coefficients).t 值 (t)、P 值 (Sig.)、 回 归 系 数 的 95% 可 信 区 间 (95.0% Confidence 
Interval for B)。 本 例 , 回归 方程 的 常数 项 为 -13.079、 回 归 系 数 为 9.939, 回归 系数 的 检验 :=6.582, P<0.001， 
说 明 饮水 握 含 量 (X) 与 骨 X 线 改变 指数 (7) 之 间 存 在 直线 回归 关系 , 回归 方程 为 : 疼 = -13.08+ 9.94X。 
2.8.2 ”线性 相关 
根据 例 11-2 的 资料 介绍 线性 相关 分 析 。 
研究 男 青年 身高 与 前 辟 长 的 相关 性 , 数据 录入 如 附 图 65 所 示 。 其 中 ,“X” 为 身高 ;“Y” 为 前 臂 长 。 
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附 图 65 ” 表 11-3 的 数据 集 


两 变量 简单 线性 相关 分 析 可 通过 “Analyze” 一 “Correlate” 一 “Biovariate...” 实现。 在 弹出 的 对 话 框 左 侧 
的 变量 列表 中 选中 要 分 析 的 变量 , 单 击 按钮 “只”, 将 变量 选 人 到 “Variables” 变量 列表 中 , 本 例 为 “身高 [X 了 
和 前臂 长 LY 了 了 了。 在 “Correlation Coefficients” 框 中 选择 “Pearson” , 表示 做 线性 相关 分 析 。 如 附 图 66 所 示 。 
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附 图 66 ”Bivariate Correlations 对 话 框 


单 击 “OK” 完成 。 输 出 的 主要 结果 如 下 : 


Correlations 


Pearson Correlation 
Sig.(2-tailed ) 
N 

前 臂 长 Pearson Correlation 
Sig.(2-tailed) 
N 








**. Correlation is significant at the 0.01 level(2-tailed ). 


主要 结果 以 矩阵 的 形式 给 出 , 包括 两 变量 的 Pearson 相关 系数 (Pearson Corelation ) 总体 相关 系数 假设 检 
验 的 已 值 (Sig.(2-tailed ))、 样 本 量 (N)。 本 例 ,r=0.801, 忆 =0.003, 说 明 身 高 与 前 臂 长 之 间 存 在 线性 相关 关系 。 
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2.9 多 元 线性 回归 


根据 例 12-2 的 资料 介绍 多 元 线性 回归 。 
研究 糖尿 病 患者 糖化 血红 蛋白 (HbAle) 的 主要 危险 因素 , 数据 录入 如 附 图 67 所 示 。 
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附 图 67 ” 表 12-5 对 应 的 数据 集 








多 元 线性 回归 分 析 可 通过 “Analyze” 一 “Regression” 一 “Linear...” 实现 。 在 弹出 的 对 话 框 左 侧 的 变量 列 
表 中 选中 应 变量 糖化 血红 蛋白 (了 ), 单 击 按钮 “小 ”, 将 变量 选 入 到 “Dependent" 框 中 ; 选择 自 变量 , 单 击 按钮 
“和 路”, 将 其 放 和 人 “Independent" 列表 中 ,本 例 自 变 量 为 年 龄 (和 %)、 体 重 指数 ( 芒 )、 总 胆固醇 ( 鸟 )、 收 缩 压 ( 乱 ) 和 
舒张 压 ( 斋 )。 

在 “Method 框 中 选择 自 变量 方法 , SPSS 提供 了 5 个 选项 : “Enter” 为 全 部 自 变量 进入 法 , 是 系统 的 默认 
值 ;“Remove” 为 消去 法 ; “Forward” 为 向 前 法 ;“Backward” 为 向 后 法 ; “Stepwise” 为 逐步 回归 法 。 本 例 , 选择 
“Stepwise”。 如 附 图 68 所 示 。 
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附 图 68 Linear Regression 对 话 框 
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点 击 “Options...”, 在 弹出 的 对 话 框 中 , 选中 “Stepping Method Criteria” 框 内 的 “Use probability of F”, 分 别 
在 "Entry:”“Removal: ”后 键 和 人 纳入、 剔除 标准 , 本 例 为 0.10、0.15。 单 击 “Continue”。 
最 后 单 击 “OK” 完成 。 输 出 的 主要 结果 如 下 : 








(1) 逐步 法 中 每 一 步 所 拟 合 的 模型 的 拟 合 优 度 情况 
Model Suminery 





a. Predictors: (Constant), X3 
b. Predictors:( Constant), X3, X2 
c. Predictors: (Constant), X3, X2, X4 


(2) 逐步 法 中 每 一 步 所 拟 合 的 模型 的 方差 分 析 表 




















ANOVA4 

Model Sum of Squares df Mean Square F Sig. 

Regression 地 1 .717 16.640 .001” 
Residual .775 18 .043 
Total 1.492 19 

2 Regression .841 .421 10.993 .001° 
Residual .651 17 .038 
Total 1.492 19 

3 Regression 1.001 3 .334 10.889 .000° 
Residual .491 16 .031 

L Total 1.492 19 

















a. Predictors:( Constant ), X3 

b. Predictors:(Constant), X3, X2 

c. Predictors:(Constant), X3 , X2, X4 
d. Dependent Variable: Y 


(3) 逐步 法 中 每 一 步 所 拟 合 的 模型 的 自 变量 情况 及 其 参数 估计 与 检验 
Coefficients® 
Unstandardized Coefficients “| Standardized Coefficients 
























Std. Error Beta t 
(Constant ) 


X3 





(Constant ) 











X3 .111 .025 .697 4.350 .000 
X2 .027 .015 .289 1.805 .089 
Constant ) 4.799 667 7.193 000 
X3 .097 .024 .611 4.125 .001 
X2 .031 .014 .330 2.287 .036 
X4 .008 .004 .341 2.285 .036 














a. Dependent Variable: Y 
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结果 (1) 为 逐步 法 中 每 一 步 所 拟 合 模 型 的 拟 合 优 度 情况 简 表 , 包括 复 相关 系数 (R)、 决 定 系数 (R 
Square)、 校 正 决定 系数 ( Adjusted R Square)、 估 计 标 准 误 (Std. Error of the Estimate )。 由 表 及 其 备注 可 知 , 本 例 
共 进 行 了 3 步 筛选 , 其 中 模型 1 仅 含有 X3、 模 型 2 含有 X3 和 X2、 模 型 3 含有 X3、X2 和 X4。 最 后 一 个 模型 ， 
即 模型 3 为 最 优 模型 , 复 相关 系数 为 0.819, 决定 系数 为 0.671, 校正 决定 系数 为 0.610。 

结果 (2 ) 为 逐步 法 中 每 一 步 所 拟 合 模型 的 方差 分 析 表 , 包括 模型 序号 及 变异 来 源 (Model)、 离 均 差 平方 
和 (Sum of Squares )、 自 由 度 (df)、 均 方 (Mean Square) 下 值 (F) 和 尸 值 (Sig.)。 本 例 , 3 个 模型 均 有 统计 学 意义 ， 
其 中 , 最 优 模型 (模型 3) 对 应 的 F=10.889, P=0.000。 

结果 (3 ) 为 模型 参数 的 估计 及 检验 结果 , 包括 模型 序号 及 包含 的 自 变量 (model)、 未 标准 化 的 偏 回归 系数 
及 其 标准 误 (unstandardized coefficients )、 标 准 化 偏 回归 系数 (standardized coefficients )、1 值 (t)、.P 值 (sig.)。 最 
后 得 到 的 回归 方程 为 :六 =4.799+0.031 肪 +0.097 名 +0.008 瑟 ,可 以 认为 体重 指数 (为 )、 总 胆固醇 ( 钱 ) 和 收缩 
压 (%) 是 影响 糖化 血红 蛋白 (7 了) 的 主要 因素 。 











2.10 ”logistic 回归 


2.10.1 二 分 类 资料 的 logistic 回归 

根据 例 13-2 的 资料 介绍 二 分 类 资料 的 logistic 回归 。 

研究 某 种 药物 治疗 骨折 效果 , 数据 录入 如 附 图 69 所 示 。 其 中 , state 为 分 层 因素 ; n 为 每 层 观 察 到 的 频 
数 ; Y 为 疗效 评价 :0= 差 ,1= 好 ; X1 为 骨折 类 型 :0= 闭合 , 1 = 开放 ; X2 为 是 否 手术 : 0= 非 手术 , 1= 手术 ; 
X3 为 是 否 服药 :0= 未 服药 ,1= 服药; X4 为 治疗 时 间 : 1= “1 周一 ,2=“11 周 ~ 一 ,3="“21 周 一 。 
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附 图 69 例 13-2 对 应 的 数据 集 
本 例 观察 到 的 资料 为 每 层 下 的 例 数 (频数 表 资 料 ), 需 首先 对 原始 数据 进行 加 权 , 加 权 的 方法 参见 节 
2.6.1。 本 例 ,权重 变量 为 “n”。 
二 分 类 资料 的 logistic 回归 可 通过 “Analyze” 一 “Regression” — “Binary logistic.. .” 实现 。 在 弹出 的 对 话 
框 左 侧 的 变量 列表 中 选中 应 变量 Y, 单 击 按钮 “名 ”, 将 应 变量 选 和 人 到 “Dependent 栏 框 中 , 本 例 应 变量 为 
疗效 评价 (Y); 在 弹出 的 对 话 框 左 侧 的 变量 列表 中 选中 所 要 分 析 的 自 变 量 , 单 击 按钮 “路 ”, 将 自 变 量 选 入 
“Covariates” 列 表 框 中 。 在 下 方 的 “Method” 列表 中 选择 “Forward: LR”"。 如 附 图 70 所 示 。 
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附 图 70 ”Logistic Regression 对 话 框 


单 击 “ ', 赋 哑 变量 。 将 需 赋 哑 变量 的 自 变量 选 和 人 “Categorical Covariates” 列 表 框 中 , 本 例 选 
和信 X4。 在 “Change Contrast” 中 定义 哑 变 量 赋值 的 对 照 水 平 。 本 例 选 择 “Reference Category” 为 “First”， 再 单 


Categorical... 








击 “Change”, 以 完成 对 照 水 平 的 定义 , 本 例 为 以 第 一 水 平 为 对 照 组 。 单 击 “Continue"。 如 附 图 71 所 示 。 
习 
Covariates: Categorical Covariates: 
[ZS mse bl Top 一 -一 
人 人 方法 BC2] 
| Hi pt] 














附 图 71 


赋 哑 变量 的 对 话 杠 


单 击 “Options...”, 选择 “CI for exp(B): 95%”, 表示 输出 OR 值 及 其 95% 可 信 区 间 。 并 在 “Probability for 
Stepwise” 中 键入 纳入 (Entry: )、 剔 除 (Removal: ) 标 准 。 本 例 为 0.05、0.10。 单 击 “Continue”。 
最 后 , 单 击 “OK” 完成 。 输 出 的 主要 结果 如 下 : 


Variables in the Equation 


























X4 
X4(1) 
X4(2) 
Constant 
X3 

X4 
X4(1) 
X4(2) 


Constant 


Step 1° 


Step 2° 








106.893 
55.267 
104.602 
112.433 
42.174 
125.018 
74.842 
114.981 
121.502 











df Sig. 
2 
1 
1 
1 
1| .000 
2 
1 
1 
E 





Exp(B) 





95% C.Lfor EXP(B) 
Lower Upper 








8.578 
27.073 
.080 
10.060 


14.638 
116.863 
.010 





4.867 
14.388 


5.012 


7.970 
48.949 


15.117 
50.940 


20.192 


26.887 
279.006 














a. Variable(s )entered on step 1: X4. 
b. Variable(s )entered on step 2: X3. 
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主要 结果 中 包括 所 进行 的 逐步 回归 的 过 程 , 以 及 每 一 步 的 logistic 回归 模型 情况 。 其 中 ,第 一 列 中 的 
Step 表示 逐步 回归 的 过 程 , 每 一 步 包 含 哪些 自 变量 ; 第 二 列 开始 为 回归 模型 的 情况 , 包括: 偏 回归 系数 (B)、 
标准 误 (SE)、Wald 检验 统计 量 (Wald)、 自 由 度 (df)、P 值 (Sig)、OR 值 (Exp(B)) 和 OR 的 95% 可 信 区 间 (95% 
C.Lfor EXP(B)), 

本 例 , 共 进行 了 两 步 得 选 , 第 一 步 (Stepl) 仅 人 选 了 一 个 自 变量 X4; 第 二 步 (Step2) 入 选 了 两 个 自 变量 
X3、X4, 为 最 终 方 程 。 这 两 个 自 变量 回归 系数 的 Wald 检验 PP 值 均 具有 统计 学 意义 (P<0.001), 提示 它们 是 
骨折 治疗 效果 (7) 的 独立 影响 因素 。 在 相同 的 治疗 时 间 条 件 下 , 服药 骨折 病人 获得 好 疗效 的 可 能 性 比 不 服 
药 骨 折 病 人 更 大 , 其 优势 比 为 10.060; 在 相同 的 服药 情况 下 , 治疗 时 间 越 长 获得 好 的 疗效 的 可 能 性 越 大 , 其 
中 治疗 周 数 在 11 周 以 上 相对 于 11 周 以 下 的 优势 比 为 14.638, 治疗 周 数 在 21 周 以 上 相对 于 11 周 以 下 的 优势 
比 为 116.863。 

2.10.2 条件 logistic 回归 

根据 例 13-3 的 资料 介绍 条 件 logistic 回归 。 

研究 胃癌 发 病 的 危险 因素 , 数据 录入 如 附 图 72 所 示 。 其 中 , 自 变量 (X1~X7) 与 应 变量 (Y ) 的 赋值 情况 
同 表 13-9, 此 处 略 。 由 于 SPSS 进行 条 件 logistic 回归 时 需 借助 生存 分 析 的 相关 模块 完成 , 因此 , 在 数据 集中 
虚拟 了 一 个 时 间 变 量 “time”, 其 本 身 的 赋值 没有 实际 意义 , 赋值 也 不 会 影响 最 终 的 输出 结果 。 需 要 注意 的 
是 ,通常 假定 对 照 组 的 存活 时 间 长 于 病例 组 , 因此 在 赋值 时 , 对照 组 的 时 间 需 大 于 病例 组 的 时 间 。 本 例 , 病 
例 组 的 time=1, 对 照 组 的 time=2。 
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附 图 72 例 13-3 的 数据 集 


条 件 logistic 回归 可 通过 “Analyze” 一 “Survival” 一 “Cox Regression...” 实现 。 在 弹出 的 对 话 框 左 侧 的 变量 
列表 中 选中 时 间 变量 time, 单 击 按钮 “ 哮 ”, 将 时 间 变 量 选 入 到 “Time” 框 中 ,将 应 变量 Y 选 入 到 “Status” 框 中 ， 
点 击 “Define Event"( 定 义 事件 赋值 ) 录 入 “1”; 将 自 变 量 选 人 “Covariates” 列表 框 中 , 并 在 下 方 的 “Method” 列 
表 中 选择 “Backward: Wald”。 将 “配对 变量 ” 选 入 “Strata” 框 中 。 如 附 图 73 所 示 。 

单 击 “Options.…”, 选择 “CI for exp(B): 95%”, 表示 输出 OR 值 及 其 95% 可 信 区 间 。 并 在 “Probability for 
Stepwise” 中 键入 纳入 (Entry: )、 剔 除 (Removal: ) 标 准 。 本 例 为 0.15、0.20。 单 击 “Continue”。 
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附 图 73 ”Cox Regression 对 话 框 
最 后 , 单 击 “OK" 完成 。 输 出 的 主要 结果 如 下 : 
Variables in the Equation 
[= | 95.0% CI for Exp( B) 
B SE Wald df Sig. Exp(B) Lower Upper 
I ll 
Step 1 XI1 322 1.284 .063 1 .802 By pa .058 8.987 
X2 一 -206 .369 .314 .575 .813 .395 1.675 
3 .197 .889 .049 1 .825 .822 .144 4.690 
X4 .418 .288 2.100 -147 L519 .863 2.673 
X5 .930 .395 5.546 .019 2.534 1.169 5.492 
X6 .873 .5317 2.852 1 .091 2.394 .869 6.594 
X7 1.099 .582 3.570 .059 3.002 .960 9.388 
Step 2 X1 ~ 1.290 .063 1 .801 323 .058 9.058 
X2 a .353 .421 1 .516 -95 .398 1.588 
X4 .426 .288 2.195 1 .138 1.531 .871 2.691 
X5 .949 .388 5.964 1 .015 2.582 1.206 5.529 
X6 .859 St 2.761 1 .097 2.361 .857 6.501 
7 1.096 .581 3.563 1 .059 2.993 .959 9.344 
Step 3 X2 = .340 .552 1 .457 .776 .398 1313 
X4 .431 -287 2.260 1 .133 1.540 .877 2.702 
X5 .950 .392 5.867 1 .015 2.586 1.199 5.580 
X6 .819 .492 2.769 1 .096 2.268 .864 5.949 
X7 1.059 .561 3.554 1 .059 2.882 .959 8.663 
Step 4 X4 .404 .286 1.986 1 .159 1.497 .854 2.625 
.881 .368 5.742 4 .017 2.414 1.174 4.964 
X6 .832 .495 2.820 1 .093 2.297 .870 6.062 
号 X7 业 Ls .560 4.230 1 .040 3.162 1.056 | 9.471 
主要 结果 与 节 2.10.1 中 介绍 的 二 分 类 logistic 回归 结果 类 似 , 可 参考 学 习 。 本 例 , 第 四 步 得 到 的 方程 
为 最 终 方 程 , 其 中 含有 4 个 自 变量 嘉 盐 渍 食物 及 重 盐 饮食 (X4)、 不 良 饮食 习惯 (X5) 吸烟 (X6)、 精 神 因素 





(X7)。 均 为 危险 因素 , 其 对 应 的 OR 值 分 别 为 1.497、2.414、2.297 和 3.162。 可 见 ,改变 喜 盐 渍 食物 及 重 盐 饮 
食 不良 饮 食 习 惯 .吸烟 等 嗜好 、 减 少 负面 的 精神 因素 , 可 降低 患 胃癌 的 风险 。 


[ny 
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2.11 生存 分 析 


2.11.1 生存 率 的 估计 、 生存 曲线 的 绘制 与 比较 
根据 例 14-2 的 资料 介绍 生存 率 的 估计 、 生 存 曲线 的 绘制 与 比较 。 
研究 乳腺 癌 的 生存 率 , 数据 录入 如 附 图 74 所 示 。 其 中 , "生存 时 间 ” 为 患者 从 手术 后 到 患者 复发 的 时 间 


(个 月 ); "结局 "为 患者 的 生存 情况 :0= 未 复发 ( 删 失 ), 1= 复 发 ; “组 别 "为 分 组 因素 :1= 肿瘤 直径 <2cm, 2= 
肿瘤 直径 >5cm。 
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附 图 74 例 14-2 的 数据 集 
生存 率 的 估计 、 生 存 曲线 的 绘制 与 比较 可 通过 “Analyze" 一 "Survival "一 “Kaplan-Meier 实现 。 在 弹 
出 的 对 话 框 左 侧 的 变量 列表 中 选中 "生存 时 间 ”, 单 击 按钮 “ 哆 ”, 选 人 “Time:" 框 中 ; 选中 “结局 "”, 单 击 按钮 
“路 , 选 人 "Statmns:" 框 中 ; 选中 "组 别 ", 单 击 按钮 “ 哆 ", 选 到 "Factor:" 框 中 。 如 附 图 75 所 示 。 
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附 图 75 Kaplan-Meier 对 话 框 


击 “Status: "下方 的 “Define Event...”, 定义 事件 发 生 的 赋值 。 本 例 为 “复发 ", 取 值 为 “1”。 在 弹出 的 对 
话 框 ，“Value(s )indicating event has occurred” 下 选择 “Single value:”, 在 其 后 的 框 中 键入 “1”"。 单 击 “Continue” R 
单 击 “Compare Factor...”, 在 弹出 的 对 话 框 中 ,“Test Statistics” 下 , 选择 “Log rank”。 单 击 “Continue”。 

单 击 “Options.…”, 在 弹出 的 对 话 框 中 ,“Statistics” 下 选择 “Survival table(s) 和 “Mean and median survival” 
以 显示 不 同时 间 点 的 生存 率 以 及 生存 时 间 的 均 数 和 中 位 数 ; 选择 “Plots” 下 的 “Survival” 以 绘制 生存 曲线 。 单 


击 “Continue”。 
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K ”完成 。 输 出 的 主要 结果 如 下 : 
(1) oi 


Case Processing Summary 





Censored 


Overall 





(2) 不 同 组 别 中 每 个 病例 的 生存 情况 


























Survival Table 
Cumulative Proportion 
Surviving at the Time N of Cumulative | N of Remaining 
组 别 Time Status Estimate Std. Error Events Cases 
1 1 10.000 1 .933 .064 1 14 
2 10.000 0 . 1 13 
3 13.000 1 .862 .091 2 12 
4 18.000 1 .790 .108 3 11 
5 25.000 0 ; 3 10 
6 29.000 1 .711 .123 4 9 
7 30.000 1 .632 .132 $ 8 
8 33.000 1 .553 .137 6 7 
9 46.000 1 .474 .138 6 
10 50.000 0 : : 7 5 
11 54.000 1 .379 .139 8 4 
12 68.000 0 . 8 3 
13 71.000 1 .253 .139 9 2 
14 88.000 0 9 
15 95.000 0 9 0 
2 1 5.000 1 952 .046 1 20 
2 9.000 1 905 .064 2 19 
3 13.000 3 18 
4 13.000 1 810 .086 4 17 
5 14.000 1 762 .093 5 16 
6 15.000 1 714 .099 6 15 
gs 19.000 1 667 .103 yt 14 
8 20.000 1 619 .106 8 13 
9 21.000 1 571 .108 9 12 
10 22.000 1 524 .109 10 11 
11 24.000 1 476 .109 11 10 
12 25.000 1 429 .108 12 9 
13 26.000 1 381 .106 13 8 
14 27.000 1 333 .103 14 7 
15 28.000 1 286 .099 15 6 
16 32.000 1 238 .093 16 5 
fz 47.000 1 190 .086 17 4 
18 52.000 1 143 .076 18 3 
19 54.000 1 095 .064 19 2 
20 60.000 1 048 .046 20 1 
21 86.000 1 | 000 .000 21 0 
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(3 ) 生存 时 间 的 均 数 和 中 位 数 情况 


Means and Medians for Survival Time 




















| Mean” Median 
| 95% Confidence Interval 95% Confidence Interval 
组 别 Estimate | Std. Error | Lower Bound Upper Bound Estimate | Std. Error | Lower Bound Upper Bound 
1 51.888 8.600 35.032 68.744 46.000 16.738 13.193 78.807 





2 29.143 4.352 20.613 37.673 24.000 3.052 18.019 29,981 








Overall 37.772 4.554 28.845 46.698 28.000 2.824 22.466 33.534 


a. Estimation is limited to the largest survival time if it is censored. 





(4) 两 组 生存 曲线 比较 的 log rank 检验 结果 


Overall Comparisons 
| 
Log Rank( Mantel-Cox ) 6351| 1| .012 


Test of equality of survival distributions forthe different levels of 组 别 . 


(5) 两 组 生存 曲线 比较 图 ( 附 图 76) 





Survival Functions 
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附 图 76 两 组 生存 曲线 图 


结果 (1 ) 为 病例 情况 的 概述 , 包括 组 别 、 分 析 的 病例 总 数 (Total N)、 发 生 事件 的 病例 数 (N of Events)、 截 
尾 病 例 的 情况 (Censored)。 本 例 ,组 1( 肿 瘤 直径 <2cem)、 组 2( 肿 瘤 直径 >5cm) 分 别 分 析 15 例 .22 例 , 共 分 析 
36 例 ; 其 中 ,组 1 复发 9 例 , 截 尾 6 例 , 截 尾 病例 占 40.0%; 组 2 复发 21 例 , 截 尾 0 例 ; 两 组 共 复发 30 例 , 截 
尾 6 例 , 截 尾 病例 占 16.7%。 

结果 (2 ) 为 不 同 组 别 中 每 个 病例 的 生存 情况 , 包括 组 别 、. 生 存 时 间 (Time)、 生 存 状态 (Status)、 累计 生存 
率 ( Cumulative Proportion Surviving at the Time)、 事 件 的 累计 发 生 例 数 (N of Cumulative Events )、 未 发 生 事 件 的 
例 数 (N of Remaining Cases )。 本 例 事 件 定 义 为 “复发 ”。 

结果 (3 ) 为 生存 时 间 的 均 数 和 中 位 数 情况 , 包括 组 别 、 生 存 时 间 的 均 数 (Mean) 生存 时 间 的 中 位 数 
(Median ), 反映 的 均 数 和 中 位 数 的 信息 包括 估计 值 (Estimate )、 标 准 误 (Std. Error)、95% 可 信 区 间 (95% 
Confidence Interval )。 本 例 , 组 划 (肿瘤 直径 <2cm ) 生 存 时 间 的 中 位 数 为 46.000 个 月 ,标准 误 为 16.738 个 月 ， 
95% 可 信 区 间 为 (13.193, 78.807 ) 个 月 ; 组 2( 肿 瘤 直径 > Sem ) 生 存 时 间 的 中 位 数 为 24.000 个 月 ,标准 误 为 
3.052 个 月 ,95% 可 信 区 间 为 (18.019, 29.981 ) 个 月 。 
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结果 (4 ) 为 两 组 生存 曲线 比较 的 log rank 检验 结果 ， 包括 检验 统计 量 (Chi-Square )、 自由 度 (df)、P 值 
(Sig.)。 本 例 ,x?=6.351, P=0.012, 可 认为 肿瘤 直径 <2cm 的 患者 较 肿瘤 直径 > 5cm 的 患者 生存 曲线 不 同 。 

结果 (5 ) 为 两 组 生存 曲线 比较 图 。 图 中 随访 时 间 为 横 轴 , 生存 率 为 纵 轴 “+” 表示 在 对 应 的 生存 时 间 ( 个 
月 ) 上 出 现 了 截 尾 病例 。 实 线 代表 组 1, 虚线 代表 组 2, 图 中 显示 组 1( 肿 瘤 直 径 <2cm ) 生 存 曲线 较 高 、 下 降 比 
较 平缓 , 而 组 2( 肿 瘤 直 径 > 5em ) 生 存 曲线 较 低 、 下 降 陡 峭 , 故 肿瘤 直径 <2cm 的 患者 较 肿瘤 直径 > Secm 的 患 
者 生存 率 高 , 复发 率 低 。 
2.11.2 ”多 变量 Cox 回归 分 析 

根据 例 14-4 的 资料 介绍 多 变量 Cox 回归 分 析 。 

研究 乳腺 癌 患 者 手术 治疗 后 生存 率 的 影响 因素 ,数据 录入 如 附 图 77 所 示 。 其 中 , 自 变量 (XI1~X6 ) 与 生 
存 时 间 (t)、 生 存 结局 (Y ) 的 赋值 情况 同 表 14-4, 此 处 略 。 
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附 图 77 例 14-4 的 数据 集 





Cox 回归 分 析 可 通过 “Analyze” 一 “Survival” 一 “Cox Regression...” 实现。 在 弹出 的 对 话 框 中 左 侧 的 变量 
列表 中 ,选中 生存 时 间 变 量 , 单 击 按钮 “只”, 选 和 到 “Time:” 框 中 , 本 例 为 “'; 选中 生存 状态 变量 , 单 击 按钮 
起 ” , 选 入 到 “Status:” 框 中 ,本 例 为 “Y” ,并 单 击 “Define Event...” 定义 事件 发 生 的 赋值 ， 方法 参见 节 2.11.1; 
选中 所 有 的 自 变 量 , 单 击 按钮 “路”, 选 入 到 “Covariates” 框 中 , 本 例 为 “X1”"~“X6”"。 并 在 “Method” 下拉 菜单 
中 选择 “Forward: wald”, 以 筛选 自 变 量 , 否则 默认 为 “Enter” , 全 部 自 变 量 均 进入 模型 。 如 附 图 78 所 示 。 
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附 图 78 ”Cox Regression 对 话 框 
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单 击 “Options...”, 在 “Model Statisitcs” 下 , 选择 “CI for exp(B)”, 以 输出 HR 的 95% 可 信 区 间 ; 在 
“Probability for Stepwise” 下 的 “Entry:” 和 “Removal: ”后面 的 框 中 分 别 输入 进行 逐步 回归 的 纳 人 人、 剔除 标准 ， 


本 例 分 别 为 0.05、0.10。 单 击 “Continue”。 
单 击 “OK” 完成 。 输 出 的 主要 结果 如 下 : 


Variables in the Equation 











95.0% Cl for Exp( B) 








结果 给 出 了 进行 Cox 逐步 回归 分 析 的 每 一 步 的 估计 情况 , 包括 每 一 步 的 模型 中 所 含有 的 自 变量 (第 一 
列 )、 回 归 系 数 (B)、 回 归 系 数 的 标准 误 (SE)、Wald 检验 统计 量 (Wald)、 自 由 度 (df)、P 值 (Sig.)、HR 值 (Exp 
(B))、HR 的 95% 可 信和 区 间 (95.0%CI for Exp(B))。 由 结果 可 见 , 共 进 行 了 2 步 回归 , 最 终 模 型 中 含有 两 个 自 
变量 : 淋巴 结 转移 (X3 ) 和 肿瘤 大 小 (X4), 两 者 的 HR>1, 说 明 它 们 是 影响 乳腺 癌 患 者 术 后 复发 的 危险 因素 。 
在 肿瘤 大 小 相同 的 情况 下 , 有 淋巴 结 转移 者 的 复发 风险 是 无 淋巴 结 转移 者 的 4.711 倍 ; 同样 , 在 淋巴 结 转移 





情况 相同 时 , 肿瘤 大 小 每 增加 一 级 , 复发 风险 增加 2.609 倍 。 
2.12 ”随机 数 的 生成 











结合 表 15-1 介绍 可 重 现 的 随机 数 生成 方法 。 在 SPSS 中 可 通过 以 下 步骤 生成 可 重 现 的 随机 数 : 

(1) 在 生成 随机 数 之 前 , 先 定义 种 子 数 。 可 通过 “Transform” 一 “Random Number Generators...” 实现。 在 
弹出 的 对 话 框 中 “Active Generator Initialization” 下 选择 “Set Starting Point” 中 的 “Fixed Value”, 在 “Value:” 后 
的 框 中 键入 预 设 的 种 子 数 , 本 例 设置 固定 种 子 数 为 2013。 单 击 “OK” 完成 。 如 附 图 79 所 示 。 
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附 图 79 Random Number Generators 对 话 框 


(2) 在 空 的 数据 集中 第 一 列 输入 变量 “顺序 号 ”, 即 想 要 生成 的 随机 数 的 数量 。 

(3) 生成 随机 数 。 通 过 “Transform” 一 “Compute Variable...” 实现。 在 弹出 的 对 话 框 左 侧 “Target Variable:” 
框 中 键入 所 生成 的 随机 数 欲 对 应 的 变量 名 , 本 例 为 “随机 数 ”; 在 右 侧 的 “Function group: ”中 先 选 择 “Random 
Numbers” , 再 从 其 下 方 的 “Functions and Special Variables:” 列表 中 选择 欲 生 成 的 随机 数 的 分 布 类 型 , SPSS 提 
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供 多 种 分 布 类 型 的 随机 数 ,包括 :分布 、 正 态 分 布下 分 布 .Poisson 分 布 等 ,本 例 , 选择 生成 均匀 分 布 的 随机 
数 “Rv. Uniform”。 点 击 按钮 “ 合 "。 在 “Numeric Expression:” 框 中 的 “RV. UNIFORM(?,?) 函数 内 显示 的 “?” 


处 定义 随机 数 的 取 值 范围 ,分 别 输入 最 小 值 “1”、 最 大 值 “20”, 该 范围 可 由 用 户 自行 定义 。 单 击 “OK" 完 
如 附 图 80 所 示 。 
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附 图 80 Compute Variable 对 话 框 


(4) 对 随机 数 排序 。 通 过 “Transform" 一 “Rank Cases...” 实现。 在 弹出 的 对 话 框 中 ,将 左 侧 的 “随机 数 ” 
选中 , 单 击 按 钮 “和 小 ”, 将 “随机 数 " 选 入 到 “Variable(s):”" 框 中 。 单 击 “OK” 完成 。 如 附 图 81 所 示 。 
(5) 根据 随机 数 的 秩 次 和 分 组 原则 进行 分 组 。 


Rank Cases 7. 
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附 图 81 Rank Cases 对 话 框 


经 过 上 述 5 步 操作 , 可 得 到 如 附 图 82 所 示 的 数据 集 , 其 中 “R 随机 数 " 为 随机 数 的 秩 次 , “组 别 "为 根据 
分 组 原则 进行 分 组 后 的 组 号 。 为 了 简便 易 读 , 数据 集中 所 有 的 变量 均 定义 为 整数 。 可 见 , 前 三 位 受 试 者 进 
入 第 二 组 , 第 四 位 至 第 九 位 受 试 者 进入 第 一 组 , 第 十 位 受 试 者 进入 第 二 组 , 依 此 类 推 。 














附录 2 SPSS 统计 软件 上 机 实习 





=!9jxl 


ES NT ER 和 
Fle Edt View Data Transform Analyze Graphs Utilies Add-ons Window Hep 


三 目 全 于 久 W_ 如 如 本 的 机 由 再 昌 晤 名 多 旬 | 











29; Visible: 4 of 4 Variables 














“| 




















附 图 82 ” 表 15-1 对 应 的 随机 数 及 分 组 结果 
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附 表 1 标准 正 态 分 布 曲线 下 左 侧 尾部 面积 ,@(z) 值 站 二 二 全 

| 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 
30 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010 
-2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014 
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019 
-7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026 
-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036 
-5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048 
一 2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064 
-3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084 
22 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110 
1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143 
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183 
71 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233 
~ 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294 
4 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367 
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455 
a 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559 
-ld 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681 
3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823 
这 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985 
-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170 
-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379 

0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611 
一 0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867 
-0 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148 
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451 
-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776 
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121 
-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483 
-02 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 
机 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247 
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 04721 04681 0.4641 
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附 表 2 分 布 界 值 表 ( 双 侧 尾部 面积 ) D 
概率 ,PP 
自由 度 v 单 侧 : 0.25 0.20 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 

双 侧 : 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 
1 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 
2 0.816 1.061 1.886 2.920 4.303 6.965 9.925 14089 22.327 31.599 
3 0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.543 10.215 12.924 
4 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 
5 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 
6 0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959 
入 0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408 
8 0.706 0.889 1.397 1.860 2.306 2.896 2.355 3.833 4.501 5.041 
9 0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781 
10 0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587 
11 0.697 0.876 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437 
12 0.695 0.873 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318 
13 0.694 0.870 1.350 1.771 2.160 2.650 3.012 3372 3.852 4.221 
14 0.692 0.868 1.345 1.761 2.145 2.624 2.977 3.325 3.787 4.140 
15 0.691 0.866 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073 
16 0.690 0.865 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015 
17 0.689 0.863 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965 
18 0.688 0.862 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922 
19 0.688 0.861 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883 
20 0.687 0.860 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850 
21 0.686 0.859 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819 
22 0.686 0.858 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792 
23 0.685 0.858 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.768 
24 0.685 0.857 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745 
站 0.684 0.856 1.316 1.708 2.060 2.485 2.787 3.078 3.450 和 
26 0.684 0.856 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707 
六 0.684 0.855 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690 
28 0.683 0.855 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674 
29 0.683 0.854 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659 
30 0.683 0.854 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646 
31 0.682 0.853 1.309 1.696 2.040 2.453 2.744 3.022 3.375 3.633 
32 0.682 0.853 1.309 1.694 2.037 2.449 2.738 3.015 3.365 3.622 
33 0.682 0.853 1.308 1.692 2.035 2.445 2.733 3.008 3.356 3.611 
34 0.682 0.852 1.307 1.691 2.032 2.441 2.728 3.002 3.348 3.601 
35 0.682 0.852 1.306 1.690 2.030 2.438 2.724 2.996 3.340 3.591 
36 0.681 0.852 1.306 1.688 2.028 2.434 2.719 2.990 3.333 3.582 
37 0.681 0.851 1.305 1.687 2.026 2.431 2.715 2.985 3.326 3.574 
38 0.681 0.851 1.304 1.686 2.024 2.429 2.712 2.980 3.319 3.566 
39 0.681 0.851 1.304 1.685 2.023 2.426 2.708 2.976 3.313 3.558 
40 0.681 0.851 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551 
50 0.679 0.849 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496 
60 0.679 0.848 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460 
70 0.678 0.847 1.294 1.667 1.994 2.381 2.648 2.899 3.211 3.435 
80 0.678 0.846 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416 
90 0.677 0.846 1.291 1.662 1.987 2.368 2.632 2.878 3.183 3.402 
100 0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390 
200 0.676 0.843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340 
500 0.675 0.842 1.283 1.648 1.965 2.334 2.586 2.820 3.137 3.310 
1000 0.675 0.842 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300 


co 0.6745 0.8416 1.2816 1.6449 1.9600 2.3263 2.5758 2.8070 3.0902 3.2905 
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Z57Z Sv LS 897 6LT 687 667 SO'E [A ZE be'E Ose LE 30'p 69'p ZL9 9l 
Ov'Z [a4 tz 9L2 98T 967 90'E ZI O00'e 60'E Iy'E 85°E 08'E Slp LL'v 0Z9 SI 
6v'Z I97Z 5LZ ty87Z S62 SO'E sl'e I 60'E BE'E [1 99'E 68'E pep 98'p 05 9 bl 
09Z ZLZ 8 S62 SO'E ST8 SE IE'E 65 8 3b'E 09'E LL'E 00'p Sep L6'p Ify 9 El 
ZLZ 587Z 967 LO0'E 8l'E 30'E LE'E bp'E IS'E I9'E EL'E 68'E Zl'p Lp'p Ors SS5'9 ZL 
887Z O00'E ZL8 EE £2 Ep'E £5°E 65°E 99'e 9L'E 88'E po'p 3cp £9 9c's ZL9 Il 
30°E Oc'e IE'E Zr'E SE Zoe ZL8 8L'E S8'E S6'E L0Y pep Lv'p £8 9%y 5 ty69 ol 
LE'E Sp'e 95°E L9'E LL'E L8'E 96'E £0'p Olp 0cp Zep 8b'p ZL 80'5 IL'S IZL 6 
LE 8L'E 68E 00'p Ol'p Ocp 0cp 9c'pb Ep'y E59 S9'p zg'p SO'S Zh's 90'9 LS 8 
pl'p Sp 9595 省 Lb'p LS'p L9'p 9L'p Ze'p 06'p 66p ZIS 6Z5 Zs'S 68 5 ty5 9 208 人 
Ss8'p 96'b L05 Ll'S LC'S LE'S 9p'S Z5 5 09 5 0LS Z8 8 665 £79 099 9ZL I88 9 
Z09 9 5 9 559 Ep'9 ZS9 Z99 899 9L9 S58'9 869 sIL 6EL 9LL cp'8 I001T 有 
928 95 8 9p'8 958 998 SL'8 b8'8 068 868 L06 0Z6 956 096 866 S00T ZZZI b 
06'El 66'El 80tT LTIYT Spl bevl Zp'pI Lb'pl bs'pl Z9'pl 5LYT 88tTI 0TST bp'sl b0'91 tw'Ll 多 
09 .68 8 68 9% 65 5 68 人 68 [68 0 68 65 68 45 65 985 65 85 68 085 68 SC65 LT 68 0068 TS 85 c 
928I0OL 08600T ly TO0T 0T'E66 L886 IL'9L6 £9'896 60596 99 956 ZZ8y6 IT'LE6 $8176 85 .668 9[Y98 05 66/ 6LLb9 I 
a 09 08 0Z SL [4 路 6 8 业 9 9 4 8 Z 上 难 莉 甲 目 
内 那 甲 目 明 地 大 稻 妇 
a 90'0=d( 导 洽 六 并 ' 潮 司 属 和 基肥 革 ) 举 对 兴业 尹 了 J 《 举 央 
Wd vm 
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附 表 4 握 界 值 表 ( 方 差分 析 用 , 单 侧 界 值 ) 上 行 :P=0.05 下 行 :P=0.01 T 
分 母 的 分 子 的 自由 度 w 
自由 度 v。 4 2 3 4 5 6 z 8 9 10 
1 161 200 216 225 230 234 237 239 241 242 
4052 4999 5403 5625 5764 5859 5928 5981 6022 6056 
2 18.51 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.39 
98.49 99.00 99.17 99.25 99.30 99.33 99.34 99.36 99.38 99.40 
3 10.13 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78 
34.12 3082 29.46 28.71 28.24 27.91 27.67 2749 27.34 -27.23 
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 
21.20 18.00 16.59 15.98 15.52 15.21 14.98 14.80 14.66 14.54 
5 6.61 5.79 5.41 5.19 5.05 4.05 4.88 4.82 4.78 4.74 
16.26 17.27 12.06 11.39 10.97 10.67 10.45 10.27 10.15 10.05 
6 5.99 S15 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 
13.74 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7:72 
多 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63 3.60 3.57 
12.25 9.55 8.45 7.85 7.46 7.19 7.00 6.84 6.71 6.62 6.54 6.47 
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.34 3.31 3.28 
11.26 8.65 7.59 7.01 6.63 6.37 6.19 6.03 5.91 5.82 5.74 5.67 
9 $5. 入 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.13 3.10 3.07 
10.56 8.02 6.99 6.42 6.06 5.80 5.62 5.47 5.35 5.26 5.18 5.11 
10 4.69 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97 2.94 2.91 
10.04 7.56 6.55 5.09 5.64 5.39 5.21 5.06 4.95 4.85 4.78 471 
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.86 2.82 2.79 
9.65 7.20 6.22 5.67 5.32 5.07 4.88 4.74 4.63 4.54 4.46 4.40 
12 4.75 3.88 3.49 3.26 3.11 3.00 2.62 2.85 2.80 2.76 2.72 2.69 
9.33 6.93 5.59 5.41 5.06 4.82 4.65 4.50 4.39 4.30 4.22 4.16 
13 4.67 3.80 3.41 3.18 3.02 2.92 2.84 2:77 2 和 2 2.67 2.63 2.60 
9.07 6.70 5.74 5.20 4.85 4.62 4.44 4.30 4.19 4.10 4.02 3.96 
14 4.60 3.74 3.34 3.11 2.96 2.85 2377 2.70 2.65 2.60 2.56 2.53 
8.86 6.51 5.56 5.03 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 
15 4.54 3.68 3.29 3.06 2.90 2.79 2.76 2.64 2.59 2.55 2.51 2.48 
8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 273 3.67 
16 4.49 3.63 3.24 3.01 285 2.74 2.66 2.59 2.54 2.49 2.45 2.42 
8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.61 3.55 
到 4.45 3.59 3.20 2.96 2.81 2.70 2.62 2.55 2.50 2.45 2.41 2.38 
8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.45 
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2 2.34 
8.28 6.01 5.09 4.58 4.55 4.01 3.85 3.71 3.60 3 3.44 3.37 
19 4.38 3:52 3 2.90 2.74 2.63 2.55 2.48 2.43 2.38 2.34 2 
8.18 5.93 5.01 4.50 4.17 3.94 77 3.63 3.52 3.43 3.36 3.30 
20 4.35 3.49 3.10 2.87 2 2.60 2.52 2.45 2.40 2.35 2.31 78 
8.10 5.85 4.94 4.43 4.10 3.87 3.71 3.56 3.45 3.37 3.30 323 
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 237 2.32 2.28 25 
8.02 5.78 4.87 4.37 4.04 3.81 3.65 351 3.40 3.31 3.24 3.17 
py 4.30 3.44 3.05 2.82 2.66 2.55 乞 机 2.40 235 2.30 2.26 2.23 
7.94 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.18 Fi 
23 4.28 3.42 3.03 2.80 2.64 2.53 2.45 2.38 2.32 2.28 2.24 2.20 
7.88 5.66 4.76 4.86 3.94 3 3.54 3.41 3.30 321 3.14 3.07 
24 4.26 3.40 3.01 2.78 2.62 2.51 2.43 2.36 2.30 2.26 212 2.18 
7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.25 3.17 3.09 3.03 
25 4.24 3.38 2.99 2.76 2.60 2.49 2.41 2.34 2.28 2.24 2.20 2.16 
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续 表 
分 母 的 分 子 的 自由 度 w 
自由 度 v 14 16 20 24 30 40 50 75 100 200 500 ~ 

1 245 246 248 249 250 251 252 253 253 254 254 254 
6142 6169 6208 6234 6258 6286 6302 6323 6334 6352 6361 6366 

2 19.42 19.43 19.44 1945 1946 1947 1947 19.48 1949 1949 ©1950 19.50 
99.43 99.44 99.45 99.46 99.47 9948 9948 99.49 9949 9949 99.50 99.50 

3 8.71 8.69 8.66 8.64 8.62 8.60 8.58 8.57 8.56 8.54 8.54 8.53 
26.92 26.83 2669 2660 2650 2641 2635 2627 2623 2618 2614 26.12 

4 5.87 5.84 5.80 §:77 5.74 5.71 5.70 5.68 5.66 5.65 5.64 5.63 
14.24 14.15 14.02 13.93 13.83 1374 1369 13.61 13.57 13.52 13.48 13.46 

5 4.64 4.60 4.56 4.53 4.50 4.46 4.44 4.42 4.40 4.38 4.37 4.36 
9.77 9.68 9.55 9.47 9.38 9.29 9.24 9.17 9.13 9.07 9.04 9.02 

6 3.96 3.92 3.87 3.84 3.81 3.77 3.75 3.72 3.71 3.69 3.68 3.67 
7.60 尖 给 7.39 7.31 7.23 7.14 7.09 7.02 6.99 6.94 6.90 6.88 

. 3.52 3.49 3.44 3.41 3.38 3.34 3.32 3.29 3.28 3.25 3.24 3.23 
6.35 6.27 6.15 6.07 5.98 5.90 5.85 8 5.75 5.70 5.67 5.65 

8 3.23 3.20 3.15 3:12 3.08 3.05 3.03 3.00 2.98 2.96 2.94 2.93 
5.56 5.48 5.36 5.28 5.20 5.11 5.06 5.00 4.96 4.91 4.88 4.86 

9 3.02 2.98 2.93 2.90 2.86 2.82 2.80 5 2.76 2.73 2.72 Qin 
5.00 4.92 4.80 4.73 4.64 4.56 4.51 4.45 4.41 4.36 4.33 4.31 

10 2.86 2.82 ob/ 2.74 2.70 2.67 2.64 2.61 2.59 2.56 2.55 2.54 
4.60 4.52 4.41 4.33 4.25 4.47 4.12 4.05 4.01 3.96 3.93 3.91 

1 2.74 2.70 2.65 2.61 2.57 2.53 2.50 2.47 2.45 2.42 2.41 2.40 
4.29 4.21 4.10 4.02 3.94 3.86 3.80 3.74 3.70 3.66 3.62 3.60 

12 2.64 2.60 2.54 2.50 2.46 2.42 2.40 2.36 2.35 2.32 2.31 2.30 
4.05 3.98 3.86 3.78 3.70 3.61 3.56 3.49 3.46 3.41 3.38 3.36 

13 2.55 2.51 2.46 2.42 2.38 2.34 2.32 2.28 2.26 2.24 2.22 al 
3.85 3.78 3.67 3.59 3.51 3.42 3.37 3.30 3.27 3.21 3.18 3.16 

14 2.48 2.44 2.39 2.35 2.31 2.27 2.24 221 2.19 2.16 2.14 2.13 
3.70 3.52 3.51 3.43 3.34 3.26 3.21 3.14 3.11 3.06 3.02 3.00 

15 2.43 2.39 2.33 2.29 2.25 221 2.18 2.15 2.12 2.10 2.08 2.07 
3.56 3.48 3.36 3.29 3.20 到 现 3.07 3.00 2.97 2.92 2.89 2.87 

16 ay 2.33 2.28 2.24 2.20 2.16 2.13 2.09 2.07 2.04 2.02 2.01 
3.45 3.37 3.25 3.18 3.10 3.01 2.96 2.89 2.86 2.80 277 2.75 
17 2.33 2.29 2.23 2.19 2.15 2.11 2.08 2.04 2.02 1.99 1.97 1.96 
3.35 3.27 3.16 3.08 3.00 2.92 2.86 2.79 2.76 2.70 2.67 2.65 

18 2.29 2.25 2.19 2.15 2.11 2.07 2.04 2.00 1.98 1.95 1.93 1.92 
3.27 3.19 3.07 3.00 2.91 2.83 2.78 2.71 2.68 2.62 2.59 2:57 

19 2.26 2.21 2.15 2.11 2.07 2.02 2.00 1.96 1.94 1.91 1.90 1.88 
3.19 S12 3.00 2.92 2.84 2.76 2.70 2.63 2.60 2.54 2.51 2.49 
20 2.23 2.18 2.12 2.08 2.04 1.99 1.96 1.92 1.90 a 1.85 1.84 
3.13 3.05 2.94 2.86 2.77 2.69 2.63 2.56 2.53 2.47 2.44 2.42 

21 2.20 Zs 2.09 2.05 2.00 1.96 1.93 1.89 1.87 1.84 1.82 1.81 
3.07 2.99 2.88 2.80 2.72 2.63 2.58 2.51 2.47 2.42 2.38 2.36 
22 2.18 2.13 2.07 2.03 1.98 1.93 1.91 1.87 1.84 1.81 1.80 1.78 
3.02 2.94 2.83 2.75 2.67 2.58 2.53 2.46 2.42 2.37 2.33 2.31 
23 2.14 2.10 2.04 2.00 1.96 1.91 1.88 1.84 1.82 1.79 1.77 1.76 
2.97 2.89 2.78 2.70 2.62 2.53 2.48 2.41 2.37 2.32 2.28 2.26 

24 2.13 2.09 2.02 1.98 1.94 1.89 1.86 1.82 1.80 1.76 1.74 1.93 
2.93 2.85 2.74 2.66 2.58 2.49 2.44 2.36 2.33 2.27 2.23 pA 

25 2.11 2.06 2.00 1.96 1.92 1.87 1.84 1.80 1.77 1.74 下 1.71 


2.89 2.81 2.70 2.62 2.54 2.45 2.40 2.32 人 29 2.23 2.19 2.17 
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分 母 的 分 子 的 自由 度 w 

自由 度 1 2 3 4 5 6 六 8 9 
26 4.22 3.37 2.98 2.74 2.47 2.39 2.32 2.27 
7.72 5.53 4.64 4.14 3.59 3.42 3.29 3.17 
2 4.21 3.35 2.96 2.73 2.46 2.37 2.30 225 
7.68 5.49 4.60 4.11 3.56 3.39 3.26 3.14 
28 4.20 3.34 2.95 2.71 2.44 2.36 2.29 2.24 
7.64 5.45 4.57 4.07 3.53 3.36 3.23 3.11 
29 4.18 3.33 2.93 2.70 2.43 2.35 2.28 2322 
7.60 5.42 4.54 4.04 3.50 3.33 3.20 3.08 

30 4.17 3.32 2.92 2.69 2.42 2.34 257 2.21 
7.56 5.39 4.51 4.02 3.47 3.30 9 3.06 

32 4.15 3.30 2.90 2.67 2.40 2.32 225 2.19 
7.50 5.35 4.46 3.97 3.42 3.25 3.12 3.01 

34 4.13 3.28 2.88 2.65 2.38 2.30 223 2.17 
7.44 5.29 4.42 3.93 3.38 3.21 3.08 2.98 

36 4.11 3.26 2.86 2.63 2.36 2.28 2.21 2.15 
7.39 325 4.38 3.89 3.35 3.18 3.04 2.94 

38 4.10 325 2.85 2.62 2.35 2.26 2.19 2.14 
7:35 S21 4.31 3.86 3.32 3.15 3.02 2.91 

40 4.08 3.23 2.84 2.61 2.34 2.25 2.18 2 
了 3 15.18 4.31 3.83 3.29 3.12 2.99 2.88 

42 4.07 a 2.83 2.59 2.32 2.24 R17 2.11 
Wy 5.15 4.29 3.80 3.26 3.10 2.96 2.86 

44 4.06 3.21 2.82 2.58 2.31 2.23 2.16 2.10 
7.24 $$ 4.26 3.78 3.24 3.07 2.94 2.84 

46 4.05 3.20 2.81 2.57 2.30 2.22 2.14 2.09 
721 和 4.24 3.76 3.22 3.05 2.92 2.82 

48 4.04 3.19 2.80 2.56 2.30 2.21 2.14 2.08 
7.19 5.08 4.22 3.74 3.20 3.04 2.90 2.80 

50 4.03 3.18 2.79 2.56 2.29 2.20 1 2.07 
J 5.06 4.20 3.72 3.18 3.02 2.88 2.78 

60 4.00 3.15 2.76 2.52 3 亚 现 2.10 2.04 
7.08 4.98 4.13 3.65 3.12 2.95 2.82 2.72 

70 3.98 3.13 2.74 2.50 2.23 2.14 2.07 2.01 
7.01 4.92 4.08 3.60 3.07 2.91 2:77 2.67 

80 3.96 i 7 2.48 2.21 2.12 2.05 1.99 
6.96 4.88 4.04 3.56 3.04 2.87 2.74 2.64 

100 3.94 3.09 2.70 2.46 2.19 2.10 2.03 1.97 
6.90 4.82 3.98 3.51 2.99 2.82 2.69 2.59 

125 3.92 3.07 2.68 2.44 2.17 2.08 2.01 1.95 
6.84 4.78 3.94 3.47 2.95 2.79 2.65 2.56 

150 3.91 3.06 2.67 2.43 2.16 2.07 2.00 1.94 
6.81 4.75 3.91 3.44 2.92 2.76 2.62 2.53 

200 3.89 3.04 2.65 2.41 2.14 2.05 1.98 1.92 
6.76 4.71 3.88 3.41 2.90 D0 2.60 2.50 

400 3.86 3.02 2.62 2.39 wil 2.03 1.96 1.90 
6.70 4.66 3.83 3.36 2.85 2.69 2.55 2.436 

1000 3.85 3.00 2.61 2.38 2.10 2.02 1.95 1.89 
6.66 4.62 3.80 3.34 2.82 2.66 3 2.43 

co 3.84 2.99 2.60 2.37 2.09 2.01 1.94 1.88 
6.64 4.60 3.78 3.32 2.80 2.64 D3] 2.41 
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续 表 
分 母 的 分 子 的 自由 度 w 
自由 度 v。 14 16 20 24 30 40 50 75 100 200 500 ~ 
26 2.10 2.05 1.99 1.95 1.90 1.85 1.82 1.78 1.76 L372 1.70 1.69 
2.86 pg 2.66 2.58 2.50 2.41 2.36 2.28 2.25 2.19 215 2.13 
27 2.08 2.03 1.97 1.93 1.88 1.84 1.80 1.76 1.74 1.71 1.68 1.67 
2.83 2.74 2.63 2.55 2.47 2.38 2.33 2.25 221 2.16 2.12 2.10 
28 2.06 2.02 1.96 1.91 1.87 1.81 1.78 1 1.72 1.69 1.67 1.65 
2.80 2 2.60 2.52 2.44 2.35 2.30 2.22 2.18 2.13 2.09 2.06 
29 2.05 2.00 1.94 1.90 1.85 1.80 177 1.73 yd 1.68 1.65 1.64 
全 条 2.68 7 2.49 2.41 2.32 027 2.19 议 殉 2.10 2.06 2.03 
30 2.04 1.99 1.93 1.89 1.84 1.79 1.76 1.72 1.69 1.66 1.64 1.62 
2.74 2.66 2.55 2.47 2.38 2.29 2.24 2.16 2.13 2.07 2.03 2.01 
32 2.02 1.97 1.91 1.86 1.82 1.76 1.74 1.69 1.67 1.64 1.61 1.59 
2 和 2.62 2.51 2.42 2.34 2.25 2.20 2.12 2.08 2.02 1.98 1.96 
34 2.00 1.95 1.89 1.84 1.80 1.74 1.71 1.67 1.64 1.61 1.59 1.57 
2.66 2.58 2.47 2.38 2.30 2.21 2.15 2.08 2.04 1.98 1.94 1.91 
36 7.98 1.93 1.87 1.82 1.78 1.83 1.69 1.65 1.62 1.59 1.56 1.55 
2.62 2.54 2.43 2.35 2.26 到] 坏 215 2.04 2.00 1.94 1.90 1.87 
38 1.96 1.92 1.85 1.80 1.76 1 1.67 1.63 1.60 5 1.54 1.53 
2.59 2.51 2.40 2.32 2.22 2.14 2.08 2.00 1.97 1.90 1.86 1.84 
40 1.95 1.90 1.84 1.79 1.74 1.69 1.66 1.61 1.59 1.55 1.53 Sl 
2.56 2.49 287 2.29 2.20 六 证 2.05 1.97 1.94 1.88 1.84 1.81 
42 1.94 1.89 1.82 1.78 1.73 1.68 1.64 1.60 1.57 1.54 1.51 1.49 
2.54 2.46 2 2.26 2.17 2.08 2.02 1.94 1.91 1.85 1.80 1.78 
44 1.82 1.88 1.81 1.76 i 1.66 1.63 1.58 1.56 1.52 1.50 1.48 
2.52 2.44 2.32 2.24 2.15 2.06 2.00 1.92 1.88 1.82 1.78 1.75 
46 1.91 1.87 1.80 yA 171 1.65 1.62 LS 1.54 1.51 1.48 1.46 
2.50 2.42 2.30 2.22 2.13 2.04 1.98 1.90 1.86 1.80 1.76 1.72 
48 1.90 1.85 1.79 1.74 1.70 1.64 1.61 1.56 1.53 1.50 1.47 1.45 
2.48 2.40 2.28 2.20 i 2.02 1.96 1.88 1.84 1.78 1.73 1.70 
50 1.90 1.85 1.78 1.74 1.69 1.63 1.60 1.55 TS 1.48 1.46 1.44 
2.46 2.39 2.26 2.18 2.10 2.00 1.94 1.86 1.82 1.76 1.71 1.68 
60 1.86 1.81 1.75 1.70 1.65 1.59 1.56 1.50 1.48 1.44 1.41 139 
2.40 2.32 2.20 23.1 2.03 1.93 1.87 1.79 1.74 1.68 1.63 1.60 
70 1.84 1.79 E72 1.67 1.62 1.56 1.53 1.47 1.45 1.40 1.37 1.35 
2.35 2.28 2.15 2.07 1.98 1.88 1.82 1.74 1.69 1.62 1.56 1.53 
80 1.82 1.77 1.70 1.65 1.60 1.54 1.51 1.45 1.42 1.38 1.35 1.32 
2.32 2.24 2.11 2.03 1.94 1.84 1.78 1.70 1.65 1.57 i 1.49 
100 1.79 1.75 1.68 1.63 1.57 1.51 1.48 1.42 1.39 1.34 1.30 1.28 
2.26 2.19 2.06 1.98 1.89 1.79 1.73 1.64 1.59 1.51 1.46 1.43 
125 1.77 yl 1.65 1.60 1.55 1.49 1.45 1.39 1.36 1.31 7 1.25 
2.23 2.15 2.03 1.94 1.85 1.75 1.68 1.59 1.54 1.46 1.40 1.37 
150 1.76 171 1.64 1.59 1.54 1.47 1.44 1.37 1.34 1.29 105. 1.22 
2.20 2.12 2.00 1.91 1.83 1 六 1.66 1.56 1.51 1.43 1.37 1.33 
200 1.74 1.69 1.62 57 1.52 1.45 1.42 1.35 1.32 1.26 1.22 1.19 
i 2.09 1.97 1.88 1.79 1.69 1.62 1.53 1.48 1.39 L193 1.28 
400 1.72 1.67 1.60 1.54 1.49 1.42 1.38 1.32 1.28 T22 1.16 1.13 
9 四 2.04 1.92 1.84 1.74 1.64 187 1.47 1.42 1.32 1.24 1.19 
1000 1.70 1.65 1.58 1.53 1.47 1.41 1.36 1.30 1.26 1.19 Li13 1.08 
2.09 2.01 1.89 1.81 171 1.61 1.54 1.44 1.38 1.28 Lk9 1.11 
~ 1.69 1.64 1.57 1.52 1.46 1.40 1.35 1.28 1.24 tly 1.11 1.00 
2.07 1.99 1.87 1.79 1.69 1.59 1.52 1.41 1.36 1.25 lls 1.00 
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附 表 5 9 界 值 表 ( Newwan 


-Keuls 法 用 ) 上 行 :P=0.05 下 行 :P=0.01 














4 组 数 , a 
2 3 4 5 6 ZF 8 9 10 

5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 
5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 
6 3.46 4.34 4.90 5.30 5.63 5.89 6.12 6.32 6.49 
5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 
7 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 
4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37 
8 3.26 4.04 4.53 . 4.89 5.17 5.40 5.60 SI 5.92 
4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86 
9 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 
4.60 5.43 5.96 6.35 6.66 6.91 Tt3 7.33 7.49 
10 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 
4.48 Tay .7 6.14 6.43 6.67 6.87 7.05 7.21 
12 3.08 加 4.20 4.51 4.75 4.95 5.12 人 427 5.39 
4.32 5.05 5.50 5.84 6.10 6.12 6.51 6.67 6.81 
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 
4.21 4.89 5.32 5.63 5.88 6.08 5.26 6.41 6.54 
16 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03 S13 
4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35 
18 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 
4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 
20 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 
4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 
30 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 
3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 
2.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 
60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 
97 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45 
120 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 
3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30 
co 259 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 
3.64 4.12 4.60 4.76 4.88 4.99 5.08 5.16 
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附 表 6 百分率 的 置信 区 间 ”上行 : 95% 置信 区 间 ”下行 : 99% 置信 区 间 











多 3 4 5 6 2 8 9 10 11 Hi 13 





9~99 
4~100 

7~93 

3~97 

5~85 15~95 
2~92 8~98 
4-78 12~88 
2~86 7-93 


3~60 7~70 14~79 21~86 

1~69 4-~78 9-~85 15~91 

3~56 7~65 12~74 19~81 

二 人 4-74 8~81 13~87 

2-52 661 11~69 17~77 23~83 

1~61 3~69 7~77 11~83 17~89 

2~48 5~57 10-65 15~72 21~79 

1~57 3~66 6~73 10~79 15~85 

2~45 5~54 9-61 14-68 19~75 25~81 

1~54 3-62 669 ”9-76 14-81 19~86 

2~43 S~51 8~58 13~65 18~71 23~77 

1~51 3~59 5~66 9~72 13~78 17~83 

2~41 4~48 8~55 12~62 ”16-68 21~73 27~79 

1~49 2~56 5-63 8~69 12~74 16~79 21~84 

2~38 446 7~52 11~59 15-65 20~70 25~75 

1~46 2~53 5~60 8-66 11~71 15~76 19~81 

2~36 4-34 7~50 10~56 14-62 18~67 23~72 28~77 

1~44 2~51 4-57 7~63 10-69 14~74 18~78 22~82 

1~35 3~41 6-48 10~54 13~59 17~64 22~69 26~74 

1~42 2~49 4-55 7~61 10-66 13~71 17~75 21~79 

1~33 3~40 646 9~51 13~57 16-62 20-67 24~71 29~76 

1~40 2~47 453 6~58 9-63 12-68 16~73 19~77 23~81 

1~32 3~38 6~44 9~49 12~54 15~59 19~64 23~69 27~73 

1~39 2~45 4~51 6~56 9~61 11~66 15~70 18~74 22~78 

1~30 3~36 5~42 8~47 11~52 15~57 18~62 22~66 26~70 30~74 

1~37 2~43 3~49 ”6-54 8~59 11~63 14-68 17~71 21~76 24~80 

1~29 3~35 5~40 8~45 11~50 14~55 17~59 21~64 24-68 28~72 

1~36 2~42 3~47 5~52 8~57 10-61 13~66 16~70 20~73 23~77 

1~28 3-34 5~39 8-44 10-48 13~53 16~57 20-62 23~66 27~69 31~73 
1~35 2~40 3~45 5~50 7~55 10~59 13~63 15~67 19~71 22~75 25~78 
1~27 3~32 5~37 7-42 10-47 13~51 16~55 19~59 22~63 26~67 29~71 
0~33 分 39 3~44 ”5-49 7~53 9~57 12~61 15~65 18~69 21~73 24~76 
1~26 31 5~36 7~41 9-45 12~49 15~54 18~58 21-61 24~65 28~69 31~72 
0-~32 1~37 3~42 5~47 7~51 9~56 11~60 14-63 17~67 20~71 23~74 26~77 
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4 1 2 3 4 5 6 7 8 NTT 2 和 
26 013 0-20 1-25 2-30 435 7-39 9-44 12-48 14-52 17~56 ”20-60 23~63 27~67 30~70 
0-18 025 1-31 1~36 3-41 446 5~50 9~54 11~58 13-62 16-65 19~69 22~72 25~75 
27 013 019 1~24 2~29 434 638 9~42 11~46 19~50 17-54 19~58 22~61 26~65 29~68 
0-18 025 030 1-35 3~40 444 648 8~52 10~56 13~60 15~63 18~67 21~70 24~73 
28 012 0-18 1~24 2~28 433 637 8-41 11~45 13~49 16~52 19~56 22~59 25~63 28~66 
017 024 029 1-34 3-39 443 647 8~51 10~55 12~58 15~62 17~65 20~68 23~71 
29 012 0-18 1-23 2~27 432 636 8-40 10-44 13~47 15~51 18~54 21~58 24~61l 26~64 
0-17 0-23 0-28 1-33 2~37 442 6~46 8~49 10-53 12~57 14~60 17~63 19~66 22~70 
30 012 017 1-22 2-27 431 6-35 8~39 10-42 12~46 15~49 17~53 20~56 23~59 26~43 
0-16 022 027 1~32 2~36 440 5-44 7~48 9~52 11~55 14~58 16~62 19~65 21~68 
31 Ol O07 1-22 2-26 430 634 8-38 10-41 12~45 14-48 17~51 19~55 22~58 25~61 
0-16 022 027 1-31 2-35 439 5-43 7~47 9~50 11~54 13~57 16~60 18~63 20~66 
32 Ol 016 1-21 2-25 4-29 5~33 7~36 9~40 12~43 1447 16~50 19~53 21~56 24~59 
0-15 021 0-26 1~30 2-34 438 5~42 7-~46 9~49 11~52 13~56 15~59 17~62 20~65 
33 Ol 015 1-20 2~24 3~28 5~32 7~36 9~39 11~42 13~46 16~49 18~52 20~55 23~58 
0-15 020 025 130 2-34 3-37 5-41 7~44 8-48 10-51 12~54 14~57 17~60 19~63 
34 010 O015 1~19 2-23 3-28 5-31 7-35 9~38 11~41 13~44 15~48 17~51 20~54 22~56 
014 020 025 1-29 2-33 3-36 5-40 643 8-47 10~50 12~53 14~56 16~59 18~62 
35 010 015 1-19 2-23 3~27 5~30 634 8~37 10-40 13~43 15~46 17~49 19~52 22~55 
O14 020 024 1-28 232 3-35 5~39 642 8-45 10-49 12~52 14-55 16~57 18~60 
36 010 O15 1-18 2-22 3-26 5-29 633 836 10-39 12~42 1445 16-48 19~51 21~54 
O14 019 023 1-27 231 3-35 5-38 6-41 8-4 9-47 11~50 13~53 15~56 17~59 
3 O10 014 Ig 2-22 3-25 5-28 632 8-35 10-38 12-41 1444 16-47 18~50 20~54 
03 O18 023 127 230 3-34 437 640 7T-43 9-46 11~49 13~52 15~55 17~58 
38 010 014 ll18 2-21 3-25 528 632 834 10-37 11~40 13~43 15~46 18~49 20~51 
O13 018 02 1-26 230 3-33 436 639 7T-42 9-45 11~48 12-51 14-54 16-~56 
39 0-9 O14 17 221 3-24 427 631 8-33 9-36 11~39 13~42 15~45 17~48 19~50 
0~13 0~18 0~21 ~25 2-25 $32 4~35 6-38 7~41 9~44 10~47 12~49 14~53 16~55 
40 09 03 17 2-21 3-24 427 630 8-33 9-35 11~38 13-41 15~44 14-47 19~49 
OD2 01 021 1-25 2-28 3-32 435 5-38 7-40 9-43 10-46 12-49 13~52 15~54 
41 09 013 17 2-20 3-23 426 6-29 7-32 9-35 11-37 12~40 14-43 16-46 18~48 
OD 01 021 1-24 2-28 3-31 434 537 7-40 8-42 10-45 11~48 13~50 15~53 
42 09 0013 1~6 2-20 3-23 426 628 731 9~34 1037 12~39 14-42 16-45 18~47 
Ol2 017 020 1-24 227 3-30 433 5-36 7-39 8-42 9-44 11~47 13~49 15~52 
43 09 O12 v6 2-19 3-23 425 5-28 7T-31 8-33 10~36 12~39 14~-41 15~44 17~45 
O02 016 020 123 2-26 3-30 433 5-35 638 8-41 9-43 11~46 13~49 14-51 
44 09 012 1-15 2~19 3-22 425 5-28 7-30 8~33 10-35 11~38 13~40 15~43 17~45 
Oll 06 0-19 1-23 2-26 3-29 432 535 637 8-40 942 11~45 12~47 14~51 
45 08 012 Iv5 2-18 3-21 424 5-27 7-30 8-32 9-34 11~37 13~39 15~42 16~44 
Ol O15 0-19 1-22 225 3-28 431 5-34 637 8-39 9-42 10~44 12~47 14~49 
46 08 012 1~15 2-18 3-21 424 5-26 7-29 8-31 9~34 11~36 13~39 14~41 16~43 
Ol O015 09 1~22 2-25 3-28 431 5-33 6-36 7-39 9-41 10~43 12~46 13~48 
47 08 012 1~15 2-7 3~20 423 626 6-28 8-31 9-34 11~36 12~38 14~40 16~43 
Ol O15 O18 121 2-24 2-27 3-30 5-33 635 7-38 9~40 10-42 11~45 13~47 
48 08 Ol ll4 217 3-20 422 525 628 8~30 9~33 11~35 12~37 14~49 15~42 
O10 0-14 0-18 -21 2-24 2-27 3-29 5-32 635 7-37 8~40 10-42 11~44 13~47 
49 0-8 Ol llI4 2-17 2-20 4-22 5-25 6-27 7-30 9-32 10-35 12~37 13~39 15~41 
0-10 0-14 017 1-20 1~24 2-26 3-29 432 6-34 7-36 8-39 9-41 11~44 12~46 
50 07 0 1l-H4 2-7 2-19 3-22 5-24 626 7-29 9-31 10-34 11~36 13~38 15-41 
_0-10 0~14 0~17 1~20 1~23 2-26 3-28 431 5-33 7-36 8-38 9~40 11~43 12~45 
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x 
14 15 16 17 18 19 20 21 22 23 24 25 
26 
27 32~71 
27~76 
28 31~69 
26~74 
29 30-68 33~71 
25~72 28~75 
30 28-66 31~69 
24~71 27~74 
31 27-64 -30-67 -33~70 
23~69 ”26-72 28~75 
32 26-62 29~65 32~68 
22~67 25~70 27~73 
33 26-061 28-64 31~67 34~69 
21~66 24~69 26-71 29~74 
34 25-59 27-62 30-65 32-~68 
21~64 23-67 25~70 28~72 
35 24~58 26~6l 29~63 31~66 34-69 
20~63 22~66 24-68 27~71 29~73 
36 23~57 26~59 28~62 30-~65 33-67 
19~62 22~64 23~67 26-~69 28-72 
37 23~55 25~58 27-6] 30-63 32-66 34-68 
19~60 21~63 23-~65 25~68 28-70 30-73 
38 22~54 2457 26~59 29~62 31~64 33-67 
18~59 ”20-61 22~64 25~66 27-~69 29~71 
39 21~53 23~55 26-58 28~60 30-~63 32~65 35-~68 
18~S8 20-~60 22~63 24-65 26-68 28-70 30-72 
40 21~52 23~54 25~57 27~59 ”29-62 32-64 34-66 
17~57 19~59 21~61 23~64 25~66 27~68 30~71 
41 20~51 22-53 24~56 26~58 29-60 31~63 33-~65 -35-67 
17~55 19~58 21~60 23~63 25~65 27~67 29~69 31~71 
42 20~50 22~52 24-~54 26~57 28~59 ”30-61 32~64 34-66 
16~54 18~57 20~59 22~6l 24-64 26-06 28~67 -30~70 
43 19~49 21~51 23~53 25~56 27~58 29-~60 31~62 33-65 36-67 
10~53 18-56 19~58 21~60 23~62 25~65 27~66 29~69 31~71 
44 19~48 21~50 22~52 24~55 26~57 28~59 ”30-61 33~63 35~65 
15~52 I4~55 19~57 21~59 23~6l 25-63 26-65 28-~68 30~70 
45 18~47 20~49 22~51 24~54 26~56 28~58 30-60 32-62 3464 36~66 
15~51 17~54 19~56 20~58 22~60 24-62 26~64 28-66 30-68 32~70 
46 18~46 20-48 2I~50 23-53 25~55 27~57 29~59 31~6l 33~63 35~65 
15~50 16~53 18~55 20~57 22~59 23-~6l 25~63 27~65 29~67 31~69 
47 18~45 19-47 21~49 23~52 25~54 26~56 28~58 30-60 32~62 34-64 36-~66 
14-19 16~52 18~54 19~56 2I~58 23~60 25~62 26~64 28-~66 30-68 32~70 
48 17~44 19~46 21~48 22~5l 24~53 26~53 28~57 30~59 31~6l 33~63 35~65 
14~49 16~51 17-53 19~55 21~27 22~59 24-61 26~63 28~65 29~67 31-69 
49 17~43 18-45 20-47 22~50 24~52 25~54 27~56 29~58 -31~60 33~02 34~04 306~00 
14-48 15-50 17~52 19~54 20~56 22~58 23~60 25~62 27~64 29~660 31~68 32-70 
50 16~43 I8~45 ”20-47 21~49 23-51 25~63 26~55 28~57 30-59 32-~6l 34-63 36-~05 


14-47 15-49 4751 18~53 20~55 21~57 23~59 25~61 26-63 28~05 30~67 32~08 





附录 3 统计 用 表 























n n 
5 60 70 80 So 60 70 80 90 100 
1 0~11 0-9 0-~8 0~7 0-6 0-5 26 31-57 26~49 22~44 ”20-39 18~36 
0-14 012 0~10 0~9 0~8 0-7 27-61 23~53 20~48 17~43 16~39 
2 0~14 1~11 0~10 1~9 0-8 0-7 27 32~58 27~51 ”24-45 21~40 19~37 
017 014 013 O01l 0~10 0-9 29~62 24~55 21~49 18~44 16~40 
3 1~17 1~14 1~12 1~11 1~10 1~8 28 34~60 29~52 25~46 22~42 20~38 
1~20 1~17 1~15 1~13 0~12 0~10 30~64 25~56 22~50 19~45 -17~41 
4 2~19 2~16 2~14 2~13 1~11 1~10 | 29 35~62 30-~54 26~48 23~43 20~39 
1~23 1~20 1~17 1~15 1~14 1~12 32~65 27~57 23~51 20~46 18~42 
5 3~22 3~18 3~16 2~14 2~13 2~11 | 30 37-63 31~55 27~49 24~44 21~40 
2~26 2~22 2~19 1~17 1~15 1~13 33~67 28~59 24~53 21~47 19~43 
6 5~24 4~20 3~18 3~16 3~14 2~12 31 33~57 28~50 25~45 22~41 
3~29 3~24 2~21 2~19 2~17 2~14 29~60 25~45 22~49 20~44 
7 6~27 5~23 4~20 4~17 3~15 3~14 32 34~58 29~51 26~46 23~42 
4~31 4~26 3~23 3~21 2~18 2~16 30~62 26~55 23~50 21~45 
8 7~29 6~25 5~21 5~19 4~17 4~15 33 35~59 31~53 27~47 24~43 
6~33 4~29 4-~25 3~22 3~20 3~17 32~63 27~56 24~51 21~46 
9 9~31 7~26 6~23 5~20 5~18 4~16 34 36~61 32~54 28~48 25~44 
7-36 5~30 527 424 421 3~18 33~64 28~58 25~52 22~47 
10 10~34 8~29 7~25 6~22 6~20 5~18 35 38~62 33~55 29~50 26~45 
8~38 7~32 6~28 5~25 4~22 4~19 34~66 30~59 26~53 23~48 
11 12~36 10~30 8~26 7~23 6~21 5~19 | 36 34-56 30~51 27~40 
10~40 8~34 7~30 6-21 5~24 4-20 31~60 27~54 24~49 
12 13~38 11~32 9-28 8-25 7~22 ”6-20 | 37 35~58 31~52 28~47 
11~43 936 7-32 628 625 521 32-61 28~55 25~50 
13 15~41 12~34 10~30 926 823 721 | 38 36-59 32~53 29~48 
12~45 ”10-38 8~33 7-30 627 -6-23 33~62 29~56 26~51 
14 16-43 13~36 11~31 1027 9%25 822 | 39 37-60 33~54 29~49 
14-47 11~40 9~35 8~31 7-28 624 34-64 30~57 27~52 
15 18~44 15~38 13~33 11~29 10-26 924 | 40 39-61 34~55 30~50 
15~49 12~42 10~-37 9~33 8-30 7-26 35~65 31~59 28~53 
16 20~46 16~40 14~34 12~30 11~27 9~25 41 35~56 31~51 
17-51 14~44 11~38 10~34 9-3] 8~27 32~60 29~54 
17 21~48 14~81 15~36 13~32 12-28 10-~26 | 42 36~57 32~52 
18~53 15~46 12~40 11~35 10~32 9~29 33~61 30~55 
18 23~50 19~43 16~37 14~33 12~30 11~27 | 43 37~59 33~53 
20~55 16~47 14-41 12~37 10~33 9~30 34-62 30~56 
19 25~53 20~45 17~38 15~34 13~31 12-~28 || 44 38~60 34~54 
21~57 17~49 15~43 13~38 11~35 10~31 35~63 31~57 
20 27~55 22~47 18~40 16~36 14~32 13~29 || 45 39~61 35~55 
23~59 19~5] 16~44 1439 12~36 11~32 36~64 32~58 
21 28~57 23~49 20~41 17~37 15~33 14~30 || 46 36~56 
24~61 20~52 17~46 15~41 13~31 12~33 33~59 
22 30~59 25~50 21~43 18~39 16~35 14~31 上 47 37~57 
26~63 22~54 18~47 16~42 14~38 12~34 34~60 
23 32-61 26~52 22~45 19~40 17~36 15~32 || 48 38~58 
28-65 23~56 19~49 17-44 15-39 13~35 35-61 
24 34-63 23-46 20-41 18-37 16-33 |‖ 49 39~59 
29-67 21-50 18~45 16-41 14-36 36~62 
25 ”36-64 25~48 21~43 19-38 17-35 | 50 40~60 
31-69 22-52 19-46 17-42 15-38 37-63 
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大 
自由 度 _ 概率 , P( 右 侧 尾部 面积 ) 

0.995 0.990 0.975 0.950 0.900 0.750 0.500 0.250 0.100 0.050 0.025 0.010 0.005 
1 = 0.02 0.10 0.45 1.32 2.71 3.84 5.02 6.63 和 
2 0.01 0.02 0.05 0.10 021 0.58 1.39 2.77 4.11 5.99 7.38 9.21 10.60 
3 0.07 0.11 0.22 0.35 0.58 121 2.37 4.11 6.25 7.81 9.35 -11.34 12.84 
4 0.21 0.30 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86 
5 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 924 11.07 12.83 15.09 16.75 
6 0.68 0.87 1.24 1.64 2.20 3.45 5.35 7.84 1064 1259 1445 16.81 18.55 
. 0.99 1.24 1.69 Ql7 2.83 4.25 6.35 9.04 1202 14.07 16.01 18.48 20.28 
8 1.34 1.65 2.18 273 3.49 5.07 734 1022 13.36 15.51 17.53 20.09 21.95 
9 1.73 2.09 2.70 3.33 4.17 5.90 834 1139 1468 1692 19.02 21.67 23.59 
10 东 泛 2.56 3.25 3.94 4.87 6.74 934 1255 15.99 18.31 20.48 23.21 25.19 
11 2.60 3.05 3.82 4.57 5.58 758 1034 1370 1728 19.68 2192 24.72 26.76 
12 3.07 3.57 4.40 5.23 6.30 844 1134 1485 18.55 21.03 23.34 26.22 28.30 
13 7 4.11 5.01 5.89 7.04 930 1234 1598 19.81 22.36 24.74 27.69 29.82 
14 4.07 4.66 5.63 6.57 779 1017 1334 1712 2106 23:68 2612 29.14 31.32 
15 4.60 5.23 6.26 7.26 855 11.04 1434 1825 2231 25.00 2749 30.58 32.80 
16 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.30 28.85 32.00 34.27 
17 5.70 6.41 7.56 8.67 1009 1279 1634 2049 2477 27.59 30.19 33.41 35.72 
18 6.26 7.01 8.23 939 1086 1368 1734 21.60 2599 2887 31.53 3481 37.16 
19 6.84 7.63 8.91 1012 1165 1456 1834 2272 2720 30.14 32.85 36.19 38.58 
20 7.43 8.26 9.59 1085 1244 15.45 1934 2383 2841 3141 3417 37.57 40.00 
21 8.03 8.90 1028 159 1324 1634 2034 2493 29.62 32.67 35.48 38.93 41.40 
22 8.64 9.54 1098 1234 1404 1724 21.34 26.04 9081 33.92 36.78 40.29 42.80 
23 9.26 10.20 11.69 1309 1485 1184 2234 27.14 3201 35.17 3808 4164 44.18 
24 9.89 10.86 12.40 13.85 15.66 1904 2334 2824 33.20 3642 39.36 42.98 45.56 
25 10.52 11.52 13.I2 1461 1647 19.94 2434 29.34 3438 37.65 40.65 44.31l 46.93 
26 11.16 12.20 13.84 15.38 17.29 30.43 35.56 38.89 41.92 45.64 48.29 
27 11.81 12.88 14.57 16.15 18.11 31.53 36.74 40.11 43.19 46.96 49.64 
28 12.46 1356 531 16.93 -18.94 32.62 37.92 41.34 4446 48.28 50.99 
29 i3:12 14.26 16.05 17.71 -19.77 33.71 3909 42.56 45.72 49.59 52.34 
30 13.79 14.95 16.79 18.49 20.60 2934 3480 4026 43.77 46.98 50.89 53.67 
40 20.71 22.16 2443 26.51l 2905 3366 3934 45.62 5181 55.70 59.34 63.69 66.77 
50 27.99 2971 3236 3476 3769 4294 4933 5633 63.17 6750 7042 76.15 79.49 
60 35.53 37.48 4048 43.19 4646 5229 5933 6698 7440 79.08 83.30 88.38 91.95 
70 43.28 4544 4876 5lL74 5533 6L70 6933 77.S8 90.53 95.02 ”100.42 104.22 
80 S117 5354 5S7.15 6039 6428 7L4 7933 88.13 96.58 10188 106.63 112.33 116.32 
90 59.20 G61.75 65.65 69.13 73.29 8062 8933 98.64 10756 113.14 118.14 124.12 128.30 
100 0733 7006 7422 7793 8236 90.13 9933 109.14 118.50 12434 129.56 135.81 140.17 

















附录 3 统计 用 表 
附 表 8 TT 临界 值 表 ( 配对 比较 的 符号 秩 和 检验 用 ) 

单 侧 : 0.05 0.025 0.01 0.005 
双 侧 : 0.10 0.05 0.02 0.010 
5 0—15 = es 
6 2—19 Ql > ws 
3 3—25 2 一 26 0 一 28 < 
8 和 一 3 FE 1=35 0 一 36 
9 S37 5 一 40 3 一 42 1] 一 44 
10 10 一 45 8 一 47 S30 352 
11 下 一 党 10 一 56 3 5 一 61 
12 大 13 一 65 9 一 69 Dy 
13 21 一 70 17 一 74 12—79 9—82 
14 25 一 80 21 一 84 天 一 90 12 一 93 
15 30 一 90 3 19 一 101 15 一 105 
16 35 一 101 29 一 107 23 一 /地 19—117 
17 41 一 112 34 一 119 27 一 126 23 一 130 
18 47 一 124 40 一 131 32 一 139 27 一 144 
19 53 一 137 46 一 144 37 一 153 32 一 158 
20 60 一 150 52 一 158 43 一 167 37 一 173 
21 67 一 164 58 一 173 49 一 182 42 一 189 
22 75 一 178 65 一 188 55 一 198 48 一 205 
23 83 一 193 73 一 203 62 一 214 54 一 222 
24 91 一 209 81—219 69 一 231 61 一 239 
3 100—225 89—236 76 一 249 68 一 257 
26 110 一 241 98 一 253 84 一 267 75 一 276 
27 119 一 259 107 一 271 92 一 286 83 一 295 
28 130 一 276 116 一 290 101 一 305 91—315 
29 140 一 295 126 一 309 110 一 325 100 一 335 
30 151 一 314 137 一 328 120 一 345 109 一 356 
31 163 一 333 147 一 349 130 一 366 118 一 378 
32 175—353 159 一 369 140 一 388 128 一 400 
33 187 一 374 170—391 151 一 410 138 一 423 
34 200 一 395 182 一 413 162 一 433 148 一 447 
35 213=417 195 一 435 173 一 457 159 一 471 
36 227 一 439 208—458 185—481 171 一 495 
37 241 一 462 221 一 482 198 一 505 182 一 521 
38 256 一 485 235 一 506 211 一 530 194 一 547 
39 271 一 509 249 一 531 224 一 556 207 一 573 
40 286 一 534 264—556 238 一 582 220 一 600 
41 302 一 559 279 一 582 252 一 609 233 一 628 
42 319 一 584 294 一 609 266 一 637 247 一 656 
43 336 一 610 310 一 636 281 一 665 261 一 685 
44 353 一 637 327 一 663 296 一 694 276 一 714 
45 371 一 604 343 一 692 Ep 291 一 744 
406 389 一 692 361 一 720 328 一 753 307 一 774 
47 407 一 721 378 一 750 345 一 783 322 一 806 
48 426 一 750 396 一 780 362 一 814 339 一 837 
49 446 一 779 415 一 810 379 一 846 355 一 870 
50 466 一 809 434 一 841 397 一 878 373—902 
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附 表 9 了 界 值 表 ( 两 样本 比较 的 秩 和 检验 用 ) 

















1 
单 人 出 。” 双 侧 单 侧 。 ” 双 侧 AAA NS 
1 行 P=0.05 P=0.10; 2 行 P=0.025 P=0.05 
3 pu A Ee 有 
3 行 P=0.01 P=002; 4 行 P=0.005 P=0.01 0 —0 0 0000 
Wh NM 
( 较 小 n) 0 1 2 3 4 5 6 7 8 9 10 
2 3~13 3-15 3~17 4~18 4-~20 4~22 4~24 5~25 
3~19 3~21 3~23 3~25 4~26 
3 6~15 6~18 7~20 8~22 8~25 9~27 10~29 10~32 11~34 11~37 12~39 
6~21 7~23 7~26 8~28 8~31 9~33 9~36 10~38 10~41 
6~27 6~30 7~32 7-35 7~38 8~40 8~43 
6-33 6~36 6~39 7-~41 7~44 
4 11~25 12~28 13~31 ”14-34 15~37 16~40 17~43 18~46 19~49 20~52 21~55 
10~26 11~29 12~32 13~35 14-38 14~42 15~45 16~48 17~51 18~54 19~57 
10~30 11~33 11~37 12~40 13~43 13~47 14~50 15~53 15~57 16~60 
10~34 10-38 11~41 11~45 12~48 12-52 13~55 13~59 14-62 
5 19~36 20~40 21~44 23~47 24~51 26~54 27~58 28~62 30~65 31~69 33~72 
17~38 18~42 20-45 21~49 22~53 23~57 24-61 26~64 27~68 28~72 29~76 
16~39 17~43 18~47 19-51 20-55 21~59 ”22-63 23-~67 24~71 25~75 26~79 
15~40 16~44 16~49 17~53 18-57 19-61 20-65 21~69 22~73 22~78 23~82 
6 28~50 29-55 31~59 33~63 35-67 37~71 38-76 40~80 42~84 44~88 46~92 
26~52 27~57 29~61 31~65 32~70 3474 35~79 37~83 38~88 40-92 42~96 
24~54 25~59 27~63 28~68 29-73 30~78 32~82 -33~87 34~92 36-96 37~101 
23~55 24~60 25~65 26~70 27~75 28~80 30~84 -31~89 32~94 33~99 32~104 
39~66 41~71 43~76 45~81 47~86 49~91 52-95 54-100 46~105 58~110 61~114 
36~69 38~74 40-79 42~84 44~89 46-94 48~99 50~104 52~109 54-14 56~119 
34~71 35~77 37~82 39-87 ”40-93 42~98 44~103 45~109 47~ll4 49~119 51~124 
32~73 34-78 35~84 37-89 38~05 40~100 41~106 43~1ll 44~117 45~122 47-128 
8 51~85 54-90 56~96 S59~I0l 62~106 64112 67-117 69~123 72~128 75~133 77~139 
49~87 51~93 53~99 ”55~105 58~I1l0 ”60-116 62~122 65~127 67~133 70~138 72-144 
45~91 47~97 49~103 51~109 53~Il5 56~120 58~126 60~132 62~138 ”64-1H 66~150 
43-93 45-99 ”47-105 49~111 SI~Il7 53~123 54-130 ”56~136 5S8-142 60-148 -62~154 
9 66~105 69~11l 72~117 75~123 78~129 81~135 84~141 87-147 ”90-153 ”93-159 96~165 


62~109 65~115 68~121 71~127 73~134 76~140 79~146 82~152 84~159 87-165 90-171 
59~112 61~119 63~126 66~132 68~1l39 71~145 73~152 76~158 78~165 81~171 83~178 
56~115 58~122 61~128 63~135 65~142 ”67~149 69~156 72~162 74~169 76~176 78~183 


10 82~128 86~134 89~141 92~148 96~154 99~161 103~167 106~174 110~180 113~187 117~193 
TB~132 81~139 84~146 88~152 91~159 94~166 97~173 100~180 103~187 107-193 110~200 
74~ 136 77-143 79~151 82~158 85~165 88~172 91~179 93~187 96~194 99~201 102-208 


71~139 73~147 76~154 79~I6l 8I~I69 84176 86~184 89~191 92~198 ”94-206 97-213 
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附 表 10 上 崩 界 值 表 ( 三 样本 比较 的 秩 和 检验 用 ) 














Pp 
N mi n> Na 
0.05 0.01 
了 3 2 p2 4.71 
3 3 1 5.14 
8 3 3 bp 5.36 
4 2 2 5.33 
4 3 1 5.21 
5 2 1 5.00 
9 3 3 3 5.60 720. 
4 ki 5.44 6.44 
4 4 1 4.97 6.67 
有 p 2 5.16 6.53 
5 3 1 4.96 
10 4 3 3 5.79 6.75 
4 4 2 5.46 7.04 
5 3 2 5.25 6.91 
当 4 1 4.99 6.96 
11 4 4 3 5.60 7.14 
5 3 3 5.65 7.08 
) 4 py jy 721 
5 5 1 5,13 7.31 
12 4 还 4 5.69 7.65 
5 让 | 5.66 7.45 
5 5 2 5.34 7.34 
13 5 称 pr 5.66 7.76 
和 5 3 sl 7.58 
14 5 5 六 5.67 7 


15 5 5 5 5.78 8.00 



































附录 3 统计 用 表 
附 表 11 r 界 值 表 ( 双 侧 尾部 面积 ) -1 0 E 
概率 ,PP 

由 度 单 侧 : 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.000 
V 双 侧 : 0.50 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 
1 0.707 0.951 0.988 0.997 1.000 1.000 1.000 1.000 1.000 
2 0.500 0.800 0.900 0.950 0.980 0.990 0.995 0.998 0.999 
3 0.404 0.687 0.805 0.878 0.934 0.959 0.974 0.986 0.991 
4 0.347 0.608 0.729 0.811 0.882 0.917 0.942 0.963 0.974 
5 0.309 0.551 0.669 0.755 0.833 0.875 0.906 0.935 0.951 
6 0.281 0.507 0.621 0.707 0.789 0.834 0.870 0.905 0.925 
7 0.260 0.472 0.582 0.666 0.750 0.798 0.836 0.875 0.898 
8 0.242 0.443 0.549 0.632 0.715 0.765 0.805 0.847 0.842 
9 0.228 0.419 0.521 0.602 0.685 0.735 0.776 0.820 0.847 
10 0.216 0.398 0.497 0.576 0.658 0.708 0.750 0.795 0.823 
11 0.206 0.380 0.476 0.553 0.634 0.684 0.726 0.772 0.801 
12 0.197 0.365 0.457 0.532 0.612 0.661 0.703 0.750 0.780 
13 0.189 0.351 0.441 0.514 0.592 0.641 0.683 0.730 0.760 
14 0.182 0.338 0.426 0.497 0.574 0.623 0.664 0.711 0.742 
15 0.176 0.327 0.412 0.482 0.558 0.606 0.647 0.694 0.725 
16 0.170 0.317 0.400 0.468 0.542 0.590 0.631 0.678 0.708 
17 0.165 0.308 0.389 0.456 0.529 0.575 0.616 0.662 0.693 
18 0.160 0.299 0.378 0.444 0.515 0.561 0.602 0.648 0.679 
19 0.156 0.291 0.369 0.433 0.503 0.549 0.589 0.635 0.665 
20 0.152 0.284 0.360 0.423 0.492 0.537 0.576 0.622 0.652 
21 0.148 0.277 0.352 0.413 0.482 0.526 0.565 0.610 0.640 
22 0.145 0.271 0.344 0.404 0.472 0.515 0.554 0.599 0.629 
23 0.141 0.265 0.337 0.396 0.462 0.505 0.543 0.588 0.618 
24 0.138 0.260 0.330 0.388 0.453 0.496 0.534 0.578 0.607 
25 0.136 0.255 0.323 0.381 0.445 0.487 4 0.568 0.597 
26 0.133 0.250 0.317 0.374 0.437 0.479 0.515 0.559 0.588 
27 0.131 0.245 0.311 0.367 0.430 0.471 0.507 0.550 

28 0.128 0.241 0.306 0.361 0.423 0.463 0.499 0.541 

29 0.126 0.237 0.301 0.355 0.416 0.456 0.491 0.533 

30 0.124 0.233 0.296 0.349 0.409 0.449 0.484 0.526 

31 0.122 0.229 0.291 0.344 0.403 0.442 0.477 0.518 

32 0.120 0.225 0.287 0.339 0.397 0.436 0.470 0.511 

33 0.118 0.222 0.283 0.334 0.392 0.430 0.464 0.504 

34 0.116 0.219 0.279 0.329 0.386 0.424 0.458 0.498 

35 0.115 0.216 0.275 0.325 0.381 0418 0.452 0.492 

36 0.113 0.213 0.271 0.320 0.376 0.413 0.446 0.486 0.513 
37 0.111 0.210 0.267 0.316 0.371 0.408 0.441 0.480 0.507 
38 0.110 0.207 0.264 0.312 0.367 0.403 0.435 0.474 0.501 
39 0.108 0.204 0.261 0.308 0.362 0.398 0.430 0.469 0.495 
40 0.107 0.202 0.257 0.304 0.358 0.393 0.425 0.463 0.490 
41 0.106 0.199 0.254 0.301 0.354 0.389 0.420 0.458 0.484 
42 0.104 0.197 0.251 0.297 0.350 0.384 0.416 0.453 0.479 
43 0.103 0.195 0.248 0.294 0.346 0.380 0.411 0.449 0.474 
a4 0.102 0.192 0.246 0.291 0.342 0.376 0.407 0.4H 0.469 
45 0.101 0.190 0.243 0.288 0.338 0.372 0.403 0.439 0.465 
46 0.100 0.188 0.240 0.285 0.335 0.368 0.399 0.435 0.460 
47 0.099 0.186 0.238 0.282 0.331 0.365 0.395 0.431 0.456 
48 0.098 0.184 0.235 0.279 0.328 0.361 0.391 0.427 D451 
49 0.097 0.182 0.233 0.276 0.325 0.358 0.387 0.423 0.447 
50 0.096 0.181 0.231 0.273 0.322 0.354 0.384 0.419 0.443 
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附 表 12 7; 界 值 表 
概率 ,PP 3 3 

殉 单 侧 : 0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 

双 侧 : 0.50 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 
4 0.600 1.000 1.000 
过 0.500 0.800 0.900 1.000 1.000 
6 0.371 0.657 0.829 0.886 0.943 1.000 1.000 
by 0.321 0.571 0.714 0.786 0.893 0.929 0.964 1.000 1.000 
8 0.310 0.524 0.643 0.738 0.833 0.881 0.905 0.952 0.976 
9 0.267 0.483 0.600 0.700 0.783 0.833 0.867 0.917 0.933 
10 0.248 0.455 0.564 0.648 0.745 0.794 0.830 0.879 0.903 
11 0.236 0.427 0.536 0.618 0.709 0.755 0.800 0.845 0.873 
12 0.217 0.406 0.503 0.587 0.678 0.727 0.769 0.818 0.846 
13 0.209 0.385 0.484 0.560 0.648 0.703 0.747 0.791 0.824 
14 0.200 0.367 0.464 0.538 0.626 0.679 0.723 0.771 0.802 
15 0.189 0.354 0.446 0.521 0.604 0.650 0.700 0750 0.779 
16 0.182 0.341 0.429 0.503 0.582 0.635 0.679 0.729 0.762 
地 0.176 0.328 0.414 0.503 0.582 0.635 0.679 0.729 0.762 
18 0.176 0.328 0.414 0.485 0.566 0.615 0.662 0.713 0.748 
19 0.170 0.317 0.401 0.472 0.550 0.600 0.643 0.695 0.728 
20 0.161 0.299 0.380 0.447 0.520 0.570 0.612 0.662 0.696 
21 0.156 0.292 0.370 0.435 0.508 0.556 0.599 0.648 0.681 
22 0.152 0.284 0.361 0.425 0.496 0.544 0.586 0.634 0.667 
23 0.148 0.278 0.353 0.415 0.486 0.532 0.573 0.622 0.654 
24 0.144 0.271 0.344 0.406 0.476 0.521 0.562 0.610 0.642 
25 0.142 0.265 0.337 0.398 0.466 0.511 0.551 0.598 0.630 
26 0.138 0.259 0.331 0.390 0.457 0.501 0.541 0.587 0.619 
27 0.136 0.255 0.324 0.382 0.448 0.491 0.531 0S77 0.608 
28 0.133 0.250 0.317 0.375 0.440 0.483 0.522 0.567 0.598 
29 0.130 0.245 0.312 0.368 0.433 0.475 0.513 0.558 0.589 
30 0.128 0.240 0.306 0.362 0.425 0.467 0.504 0.549 0.580 
31 0.126 0.236 0.301 0.356 0.418 0.459 0.496 0.541 0.571 
32 0.124 0.232 0.296 0.350 0.412 0.452 0.489 0.533 0.563 
33 0.121 0.229 0.291 0.345 0.405 0.446 0.482 0.525 0.554 
34 0.120 0.225 0.287 0.340 0.399 0.439 0.475 0.517 0.547 
35 0.118 0.222 0.283 0.335 0.394 0.433 0.468 0.510 0.539 
36 0.116 0.219 0.279 0.330 0.388 0.427 0.426 0.504 0.533 
37 0.114 0.216 0.275 0.382 0.421 0.456 0.497 0.526 
38 0.113 0.212 0.271 六 0.378 0.415 0.450 0.491 0.519 
39 0.111 0.210 0.267 0.317 0.373 0.410 0.444 0.485 0.513 
40 0.110 0.207 0.264 0.313 0.368 0.405 0.439 0.479 0.507 
41 0.108 0.204 0.261 0.309 0.364 0.400 0.433 0.473 0.501 
42 0.107 0.202 0.257 0.305 0.359 0.395 0.428 0.468 0.495 
43 0.105 0.199 0.254 0.301 0.355 0.391 0.423 0.463 0.490 
44 0.104 0.197 0.251 0.298 0.351 0.386 0.419 0.458 0.484 
45 0.103 0.194 0.248 0.294 0.347 0.382 0.414 0.453 0.479 
46 0.102 0.192 0.246 0.291 0.343 0.378 0.410 0.448 0.474 
47 0.101 0.190 0.243 0.288 0.340 0.374 0.405 0.443 0.469 
48 0.100 0.188 0.240 0.285 0.336 0.370 0.401 0.439 0.465 
49 0.098 0.186 0.238 0.282 0.333 0.366 0.397 0.434 0.460 
50 0.097 0.184 0.235 0.279 0.329 0.363 0.393 0.430 0.456 
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附 表 13 ”随机 数字 表 
388 56 83 Zr 9 33 35 72 67 47 T7734 99 “450 0 08 18 27 38 90 16 95 86 70 75 
09 72 95 84 29 49 41 31 06 70 42 38 06 45 18 64 84 73 31 65 52” 33 37 97 i15 
12 96 88 17 31 65 19 69 02 83 60 75 86 90 68 D4: G4 1D" SPST 56 61 87 39 12 
85 94 57 24 16 92 09 84 38 76 22 00 27 69 85 29 81 94 78 10 21 94 47 90 12 
38 64 43 59 93 98 77 87 68 07 91 51 67 62 44 40 98 05 93 78 23 32 65 41 18 
53 44 09 42 72 00 41 86 79 79 68 47 22 00 20 < 00 83 63 22 55 
40 76 66 26 84 57 99 99 90 37 36 63 32 08 58 37 40 13 68 97 87 64 81 07 83 
02 17 79 18 05 12. $9 人 22 07 90 47 03 28 14 11 30 79 20 69 22 40 98 
95 17 82 06 353 31 51 10 96 46 92 06 88 07 77 56 11 50 81 69 40 23 72 51 39 
35 76: 22 2 如 96 11 83 44 80 34 68 35 48 77 33 42 40 90 60 73 96 53 97 86 
26 29 13 56 41 85 47 04 66 08 3 人 37 $9 13 82 43 80 46 15 38 26 61 70 04 
77 80 20 75 82 72 82 32 99 90 53 95 713: T6763 89 73 44 99 05 48 67 26 43 18 
46 40 66 44 52 91 36 74 43 53 30 82 13 54 00 78 45 63 98 35 $5 D3 36 67°"68 
37 56 08 18 09 77 53 84 46 47 31 91 18 95 58 24 16 74 11 53 44 10 13 85 57 
61 65 61 68 66 37 27 47 39 19 84 83 70 07 48 53 21 40 06 71 95 06 79 88 54 
93 43 69 64 07 34 18 04 52 35 56 27 09 24 86 61 85 53 83 45 19 90 70 99 00 
21 96 60 12 99 11 20 99 45 18 48 13 93 55 34 18 37 79 49 90 65 97 38 20 46 
95 20 47 97 97 2 BT 3 8 “TA 00 06 41 41 74 45 89 09 39 84 51 67 11 52 49 
%9 86 21 78 73 10 65 81 92 59 58 76 17 14 97 04 76 62 16 17 17 95 70 45 80 
62 92 06 34 13 59 7 4 2 27: 85 1T0 24, 这 23 71 82 13 74 63 52 52 01 41 
04 31 17 21 56 33 73 99 19 87 26 72 39 27 67 77 人 枚 电 60 61 97 22 61 
61 06 98 03 91 87 14 77 43 96 43 00 65 98 50 45 60 33 01 07 98 99 46 50 47 
85 93 85 86 88 72 87 08 62 40 16 06 10 89 20 23 21 34 74 97 76 38 03 29 63 
21 74 32 47 45 73 96 07 94 52 09 65 90 77 47 23 76° 16 区 33 53 05 70 53 30 
上 79 96 23 53 10 65 39 07 16 29 对 可 02 :43 10 02 87 40 41 45 
02 89 08 04 49 20 21 14 68 86 87 63 93 95 17 1 光 9000395.089 35 14 97 35 33 
87 18 15 89 79 85 43 01 72 73 08 61 74 51 69 89 74 39 82 15 94 51 33 41 67 
98 83 71 94 22 59 97 50 99 52 08 52 85 08 40 87 80 61 65 31 91 51 80 32 44 
10 08 58 21 66 72 68 49 29 31 89 85 84 46 06 59 73 19 85 23 65 09 29 75 63 
47 90 56 10 08 88 02 84 27 83 42 29 7223 19 66 56 45 65 79 20" 74 S53 20: 25 
22 85 61 68 90 49 64 92 85 44 16 40 12 89 88 50 14 49 81 06 0 到 入 有 也 
67 80 43 79 33 及 副 - 贡 江 棉 25 58 19 68 70 77 02 54 00 52 53; #3;. 7” Is: 26 
27 62 50 96 72 79 44 61 40 15 14 53 40 65 39 27 3 B02 11 3 民 到 站 
33 78 80 7 15 38 30 06 38 21 14 47 47 07 26 54 96 87 53 32 40 36 40 69 76 
13 13 92 66 99 47 24 49 57 74 32 25 43 62 17 10 97 11 69 84 99 63 22 32 98 
10 27 53 96 23 71 50 54 36 23 54 31 04 82 98 04 14 12 15 09 26 78 25 47 47 
28 41 50 61 88 64 85 27 20 18 83 36 36 05 56 39 71 的 09 62 94 76 62 11 89 
34 21 42 57 02 59 19 18 97 48 80 30 03 30 98 05 24 67 70 07 84 97 50 87 46 
GL 81 77 23 23 82 82 11 54 08 53 28 70 58 96 4 07 39 55 43 42 34 43 39 28 
61 15 18 13 54 16 86 20 26 88 90 74 80 55 09 14 53 90 51 17 52 01 63 01 59 
91 76 21 64 64 44 91 13 32 97 75 31 62 66 54 下 80 3 75 77 56 08 25 70 29 
00 97 79 08 06 37 30 28 59 85 53 56 68 53 40 0Q1 74 39 59 73 30 19 99 85 48 
36 46 18 34 94 20 80 27 "77 78 91 69 16 00 08 43 18 73 68 67 69 61 34 25 
88 98 99 60 50 65 95 79 42 94 93 62 40 89 96 43 56 47 71 66 46 76 29 67 02 
04 37 59 87 21 05 02 03 24 17 47 97 81 56 51 92 34 86 01 82 S55 Sl ‘33 12 Al 
63 62 06 34 41 94 21 78 55 09 72 76 45 16 94 29 95 81 83 83 79 88 O01 97 30 
78 47 23 53 90 34 41 92 45 71 09 23 70 70 07 12 38 92 79 43 14 85 li ‘47 23 
87 68 62 15 43 53 14 36 59 25 54 47 33 710, 3 59 24 48 40 35 50 03 42 99 36 
47 60 92 10 77 88 59 53 11 52 66 25 69 07 64 48 68 64 71 06 61 65 70 22 12 
56 88 87 59 41 65 28 04 67 53 95 79 88 37 31 50 41 06 94 76 a B83 7 M6 3 
02 57 45 86 67 73 43 07 34 48 44 26 87 93 29 77 09 61 67 84 06 69 44 77 75 
31 S54 i4 1% 这 48 62 11 90 60 68 12 93 64 28 46 24 79 16 76 14. 60 25 I Ol 
28 50 16 43 36 28 97 85 58 99 07 ‘22 $2 76, 23 24 70 36 54 54 59 28 61 71 96 
63 29 62 66 50 02 63 45 52 38 67 63 47 54 75 83 24 78 43 20 92 €3 1 47 48 
45 65 58 26 5l 76 96 59 38 72 86 57 45 71 46 44 67 76 14 55 44 88 01 62 12 
39 65 36 63 70 77 45 85 50 5] 对 和 各 |! 前 记 30 53 36 02 95 49 34 88 73 61 
73 71 98 16 04 29 18 94 51 23 76 51 94 84 86 79 93 96 38 63 08 58 25 58 94 
22 20 6 20 11 72 65 71 08 86 充 " 台 区 到 嘲 97 48 72 66 48 09 71 17 24 89 
75 17 26 99 76 89 37 20 70 01 77 31 61 95 46 26 97 05 73 51 53 33 18 72 87 
37 48 60 82 29 81 30 15 39 14 48 38 75 93 29 06 87 37 78 48 45 56 00 84 47 





中 英文 名 词 对 照 索 引 


I 类 错误 typeI error 66 

了 [类 错误 typeI error 66 

Cox 比例 风险 回归 模型 ”Cox proportional hazards 
regression model, PHREG 145 

Fisher 确切 概率 法 Fisher’s exact test 86 

Kruskal-Wallis 检验 ”Kruskal-Wallis test 99 

logistic 回归 分 析 

1 分 布 t-distribution 52 

Wald 检验 Waldtest 128 
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logistic regression analysis 125 
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case fatality rate 32 


参数 parameter 4 


参数 估计 parameter estimation 51 


standardized regression coefficient 


C3 





参数 检验 方法 parametric test 95 
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处 理 因素 ,treatment 151 
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单 言 single blind 156 


单 样本 1 检验 one-sample t-test 60 
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对 照 control 153 


多 重 比 较 multiple comparison 75 


多 元 线性 回归 multiple linear regression 114 
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variance 14 


analysis of variance, ANOVA 70 


处 性 ”homogeneity of variance 62 


非 比例 风险 模型 ”non-proportional hazards model 
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分 位 数 - 分 位 数 图 quantile-quantile plot, Q-Q plot 
了 

风险 比 ”hazard ratio, HR 146 
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复 相关 系数 multiple correlation coefficient 118 


hazard function 141 
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概率 ”probability 4 
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合并 方差 pooled variance 62 
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regression coefficient 104 
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简单 相关 simple correlation 108 
交叉 设计 cross-over design 156 
交互 效应 ”interaction effect 78 
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近似 上 检验 separate variance estimation t-test 63 
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cumulative probability of survival 


sum of squares 14 
theoretical frequency 84 
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连续 性 校正 法 correction for continuity 85 
两 独立 样本 1 检验 ”two-sample t-test 62 

两 因素 方差 分 析 two-way ANOVA 73 
临床 试验 clinical trial 155 

率 rate 28 
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盲 法 blind method 156 
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年 龄 别 死亡 率 age-specific death rate 32 
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配对 样本 均 数 1 检验 paired ttest 60 

偏 回归 系数 “partial regression coefficient 114 
偏 似 然 函数 ”partial likelihood function 146 
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分 析 survival analysis 139 
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时 变 time-dependent 148 
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实验 效应 experimental effect 152 
试验 trial 151 

数据 data 3 
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死亡 率 mortality rate 31 
死因 别 死亡 率 ”cause specific death rate 32 





死因 构成 ”proportion of dying of a specific cause 
32 

四 分 位 数 间距 quartile range 14 

四 格 表 fourfold table 84 





义 然 比 检 验 likelihood ratio test 128 

算术 均 数 arithmetic mean 9 

次 机 测量 误差 ”random measurement error 4 

随机 对 照 试验 ”randomized controlled trial, RCT 
155 

随机 化 randomization 154 

随机 区 组 设计 randomized block design 73 

随机 数 random number 154 

随机 数字 表 table of random number 154 

T 


条 件 logistic 回归 
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linear regression equation 
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